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AW AT RUMBA F FAH Bit TE E RAR HB (MCMC) RE eu HL SR T 
目标 运动 不 确定 性 条 件 下 的 视觉 目标 跟踪 问题 ,方法 和 技术 ,并 结合 多 种 实际 应 用 场景 给 出 算 
法 实现 框架 和 实验 分 析 。 全 书 共 4 章 ,第 1 章 介 绍 了 视觉 目标 跟踪 的 意义 和 基本 方法 。 第 2 章 
介绍 了 MCMC 采样 、 自 适应 MCMC 采样 的 基本 理论 、 方 法、 实现 技术 及 其 在 计算 机 视觉 中 的 应 
用 。 第 3 章 介绍 了 视觉 目标 跟踪 中 的 序 贯 粒子 采样 方法 和 序 贯 随机 逼近 蒙特 卡 洛 采样 方法 。 
第 4 章 介绍 了 面向 运动 突变 视觉 目标 跟踪 的 自 适 应 MCMC 采样 方法 。 本 书 是 视觉 目标 跟踪 与 
MCMC 采样 方面 的 专著 ,反映 了 作者 近年 来 在 这 一 领域 的 主要 研究 成 果 。 

本 书 可 作为 大 专 院 校 及 科研 院 所 图 像 处 理 、 计 算 机 视觉 和 智能 视频 分 析 领 域 的 高 年 级 本 科 
生 、 研 究 生 的 教学 和 参考 用 书 ,也 可 供 相关 领域 的 教师 、 科 研 人 员 及 工程 技术 人 员 作 参考 。 
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视觉 跟踪 是 计算 机 视觉 研究 的 一 个 基本 和 重要 环节 。 近 年 来 , 随 着 相关 学 科 
领域 理论 和 技术 的 发 展 , 视 觉 跟踪 研究 在 理论 方法 和 实现 技术 方面 得 到 了 进一步 
的 深入 和 发 展 , 并 且 在 智能 交通 \ 人 机 交互 、 视 频 监 控 和 军事 等 领域 得 到 广泛 的 应 
用 。 在 实际 应 用 中 ,视觉 跟踪 方法 通常 需要 处 理 一 些 复杂 的 情况 ,包括 :如 何 建 模 
目标 的 运动 变化 ,以 有 效 地 捕获 目标 运动 的 不 确定 性 ;如 何 设计 有 效 的 外 观 模型 以 
适应 外 观 的 显著 变化 ;如 何 设计 稳健 高 效 的 视觉 跟踪 算法 以 满足 实际 的 目标 跟踪 
任务 等 等 。 运 动 极 大 不 确定 性 条 件 下 的 目标 跟踪 是 视觉 跟踪 的 一 个 难点 ,基于 运 
动 连续 性 假设 的 传统 贝 叶 斯 滤波 跟踪 方法 在 解决 这 一 问题 时 具有 很 大 的 局 限 性 。 
本 书 系统 地 阅 述 自 适应 马 氏 链 蒙 特 卡 洛 采样 的 理论 方法 和 实现 技术 ,以 及 在 目标 
运动 极 大 不 确定 性 条 件 下 的 视觉 跟踪 方法 。 

本 书 共 分 4 章 ,主要 内 容 包 括 : 视 觉 跟 踪 的 意义 、 应 用 和 主要 方法 概述 ; 马 氏 链 
蒙特 卡 洛 采 样 和 自 适 应 马 氏 链 蒙 特 卡 洛 采样 方法 ; 序 贯 随机 通 近 蒙特 卡 洛 跟踪 方 
法 ;运动 突变 的 视觉 跟踪 方法 。 

第 1 章 简要 介绍 视觉 跟踪 的 意义 、 应 用 和 主要 方法 概述 。 简 要 分 析 视 觉 跟 踪 
的 理论 框架 和 基本 技术 ,包括 目标 表示 、 外 观 建 模 .状态 预测 与 估计 等 技术 环节 及 
其 代表 性 算法 。 

第 2 章 介绍 马 氏 链 蒙 特 卡 洛 采 样 方法 及 其 在 计算 机 视觉 中 的 应 用 。 首 先 介绍 
蒙特 卡 洛 采 样 的 基本 理论 .方法 和 实现 技术 。 在 此 基础 上 介绍 两 种 自 适应 马 氏 链 
蒙特 卡 洛 采样 方法 及 其 算法 实现 ,并 给 出 它们 在 目标 轮 廊 的 多 边 形 近 似 中 的 应 用 。 

第 3 章 介绍 序 贯 随机 各 近 蒙 特 卡 洛 跟 踪 方法 。 通 过 分 析 贝 叶 斯 滤波 框架 下 的 
粒子 滤波 和 基于 马 氏 链 蒙 特 卡 洛 采 样 的 粒子 滤波 ,引入 能 够 有 效 克 服 粒 子 退 化 问 
题 的 序 贯 随机 逼近 蒙特 卡 洛 采样 方法 。 

第 4 章 介绍 运动 突变 的 视觉 跟踪 方法 。 针 对 目标 快速 运动 .视频 镜头 切换 、 低 
帧 率 视频 等 运动 极 大 不 确定 性 的 视觉 跟踪 问题 ,介绍 一 种 将 目标 分 布 自 适应 和 提 
议 分 布 自 适应 相 结合 的 强 自 适应 马 氏 链 蒙特 卡 洛 采 样 方法 。 

本 书 第 1 章 至 第 4 章 由 周 修 庄重 继 文 编写 ;全 书 由 周 修 庄 、 重 继 文 统 稿 。 
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据 研究 ,人 类 通过 感官 感知 外 部 世界 的 信息 超过 70% 来 自视 觉 。 计 算 机 视觉 
是 在 对 人 类 视觉 特性 研究 的 基础 上 ,利用 计算 机 成 像 装置 替代 人 类 视觉 器 官 作为 
信息 输入 手段 ,由 计算 机 代替 人 脑 完成 对 输入 信息 的 处 理 和 分 析 , 使 得 计算 机 能 够 
像 人 一 样 感知 和 理解 外 部 世界 ,甚至 完成 人 类 难以 完成 的 特定 任务 。 计 算 机 视觉 
是 一 门 交叉 性 学 科 ,涉及 计算 机 科学 、 统 计 学 . 认 知 心理 学 ,物理 学 .信号 处 理 和 分 
析 ,等 等 。 近 年 来 , 随 着 各 相关 学 科技 术 的 发 展 , 计 算 机 视觉 研究 取得 了 令 人 瞩目 
的 成 就 ,在 各 个 领域 得 到 了 广泛 的 应 用 。 计 算 机 视觉 的 研究 起 始 于 20 世纪 中 叶 。 
这 个 时 期 的 研究 工作 主要 是 针对 简单 的 二 维 图 像 进行 识别 和 分 析 。 在 20 世纪 70 
年 代 , 麻 省 理工 学 院 人 工 智能 实验 室 的 David Marr 教授 提出 了 计算 机 视觉 计算 理 
ie ,该 理论 成 为 计算 机 视觉 研究 领域 中 第 一 个 具有 完整 体系 的 理论 框架 ,是 计算 机 
视觉 研究 领域 一 个 里 程 碑 式 的 工作 , 它 极 大 地 促进 了 计算 机 视觉 理论 的 研究 和 
RIRH, 

广义 上 ,视频 目标 跟踪 (视觉 跟踪 ) 是 指 对 视觉 场景 中 的 运动 目标 进行 检测 R 
别 和 跟踪 ,获得 目标 的 运动 ,状态 以 及 外 观 特性 等 参数 ,进而 对 跟踪 的 运动 目标 作 
进一步 的 处 理 与 分 析 ,实现 对 运动 目标 的 更 高 层次 的 理解 。 视 觉 跟踪 是 计算 机 视 
觉 领 域 中 的 一 个 研究 方向 。 由 于 它 具 有 极为 广阔 的 应 用 前 景 , 因 而 近年 来 已 成 为 
计算 机 视觉 领域 中 备 受 瞩目 的 研究 热点 。 视 觉 跟踪 在 军事 国防 .人 机 交互 .智能 监 
控 , 机 器 人 导航 ,智能 交通 ,生物 医 学 工程 等 领域 具有 广阔 的 应 用 前 景 中 。 
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在 军事 国防 领域 ,视觉 跟踪 技术 已 应 用 于 战场 和 基地 侦查 .导弹 制导 .地面 
和 空中 目标 攻击 等 系统 中 ,包括 :机 载 系统 对 地 面目 标的 监视 以 及 地 对 空 系统 对 
室 中 目标 的 跟踪 等 ;跟踪 和 分 析 试 验 飞机 和 导弹 的 轨迹 和 姿态 ;等 等 。 在 人 机 交 
互 方面 ,传统 的 输入 方式 已 不 能 很 好 地 满足 人 与 计算 机 的 更 为 复杂 的 交流 需要 。 
视觉 跟踪 技术 是 计算 机 识别 和 理解 人 的 各 种 姿态 和 动作 、 实 现 更 为 自然 的 人 机 
交流 的 关键 环节 之 一 。 在 智能 监控 领域 ,系统 需要 对 摄像 机 采集 到 的 视频 数据 
进行 实时 处 理 和 分 析 ,实现 自动 的 目标 检测 、 识 别 和 跟踪 。 在 此 基础 上 对 目标 的 
运动 轨迹 进行 分 析 。 目 标的 检测 .识别 .跟踪 和 行为 分 析 都 是 计算 机 视觉 领域 的 
主要 研究 课题 ,而 有 效 的 视觉 跟踪 技术 是 智能 监控 系统 中 核心 的 技术 环节 。 智 
能 机 器 人 导航 主要 通过 视觉 信息 识别 周围 场景 中 的 物体 ,实现 自主 运动 。 在 机 
器 人 手眼 应 用 中 ,视觉 跟踪 技术 可 用 于 跟踪 机 器 人 所 拍摄 的 场景 中 的 物体 .计算 
其 运动 轨迹 ,并 根据 需要 选取 最 佳 姿 势 完 成 特定 的 机 械 操作 。 智 能 交通 系统 是 
目前 交通 运输 领域 的 研究 热点 。 车 辆 的 实时 检测 、 跟 踪 和 行人 行为 分 析 是 智能 
交通 系统 的 关键 技术 。 系 统 通过 对 视频 序列 图 像 的 自动 分 析 , 完 成 车 辆 和 行人 
的 检测 与 跟踪 ,进一步 对 车 辆 和 行人 的 行为 给 出 语义 描述 。 其 中 需要 解决 的 关 
键 问题 就 是 对 车 辆 和 行人 的 分 割 与 跟踪 。 在 生物 医学 工程 领域 ,视觉 跟踪 技术 
在 超声 图 像 和 显 微 图 像 的 自动 分 析 中 有 广阔 的 应 用 前 景 。 例 如 , 显 微 图 像 序列 
中 的 杂质 与 噪声 严重 影响 了 对 图 像 中 运动 粒子 (细胞 ) 的 提取 和 分 析 , 视 觉 跟踪 
技术 利用 图 像 序列 中 目标 运动 和 外 观 变 化 的 连续 性 信息 可 以 实现 对 感 兴趣 目标 
的 跟踪 与 运动 分 析 。 

从 20 世纪 80 年 代 至 今 近 30 年 的 时 间 里 ,视觉 跟踪 的 研究 进展 迅速 ,出 现 了 
众多 的 视觉 跟踪 方法 。 然 而 ,由 于 视觉 场景 的 高 度 复杂 性 ,包括 :目标 运动 不 确定 
性 .阴影 .光照 变化 .背景 噪声 .目标 干扰 ,遮挡 .目标 变形 等 ,使 得 实现 一 个 稳健 、 准 
确 和 快速 的 视觉 跟踪 算法 依然 非常 困难 外。 传统 的 视觉 跟踪 技术 一 般 都 基于 目标 
运动 和 外 观 变 化 较 小 的 光滑 性 假设 ,因而 在 某 些 复杂 场景 中 很 难 实现 有 效 的 目标 
跟踪 。 这 些 复杂 的 视觉 场景 包括 如 下 几 个 方面 。 

1. 突变 的 动力 学 特性 

随 着 视觉 跟踪 技术 的 应 用 领域 的 不 断 扩大 ,需要 跟踪 的 运动 目标 的 动力 学 特 
征 也 呈现 出 复杂 多 样 化 。 在 实际 应 用 的 复杂 场景 中 ,运动 目标 经 常 做 不 连续 运动 ， 
包括 自身 不 确定 性 的 动力 学 特征 和 在 外 力 情况 下 的 突变 运动 中。 例如 ,网 球 运动 
员 的 突然 变速 启动 ,乒乓 球 受 球拍 撞击 后 的 变 向 运动 。 这 种 极 大 的 运动 不 确定 性 
破坏 了 传统 跟踪 算法 的 运动 连续 性 假设 ,从 而 容易 导致 跟踪 失败 。 


2. 低 帧 率 视频 

为 节省 存储 代价 ,降低 对 网 络 带 宽 的 过 度 依 赖 ,在 视频 监控 和 互联 网 实时 应 
用 领域 ,对 低 帧 率 视频 序列 中 目标 的 在 线 实时 跟踪 显得 尤为 重要 。 与 此 同时 , 低 
帧 率 往 往 导致 目标 运动 的 不 连续 和 外 观 的 显著 变化 。 尽 管 基 于 随机 采样 的 视觉 
跟踪 算法 ,例如 ,粒子 滤波 中 和 基于 马 氏 链 蒙 特 卡 洛 的 粒子 滤波 中 等 方法 ,能 够 
对 目标 状态 的 不 确定 性 进行 有 效 的 建 模 并 维持 多 模 假设 ,然而 ,目标 的 突变 运动 
和 外 观 的 显著 变化 使 得 目前 的 大 多 数 跟踪 算法 难以 实现 稳健 、 准 确 、. 快 速 的 目标 
跟踪 o 

3. 多 视角 场景 中 的 镜头 切换 

在 多 视角 多 摄像 机 的 视觉 场景 中 ,由 于 摄像 机 镜头 的 切换 导致 目标 在 空间 位 
置 .尺度 和 外 观 方面 的 不 连续 变化 。 这 种 不 连续 变化 很 容易 导致 传统 的 跟踪 算法 
失效 。 现 有 的 大 部 分 基于 随机 采样 的 概率 跟踪 算法 为 了 实现 精确 的 跟踪 任务 , 需 
要 使 用 大 量 的 粒子 在 庞大 的 状态 空间 中 逼近 复杂 的 多 模 分 布 。 因 而 ,其 计算 复杂 
度 非常 高 ,难以 满足 实际 应 用 中 的 跟踪 需要 。 

4. 目标 外 观 的 显著 变化 

运动 的 极 大 不 确定 性 ,可 能 导致 目标 外 观 的 显著 变化 。 当 前 视觉 跟踪 领域 的 
一 个 研究 热点 是 基于 外 观 模型 (Appearance Model) 的 自 适应 跟踪 。 传 统 的 视觉 跟 
踪 方 法 采用 了 静态 外 观 模型 ,这 种 模型 或 者 被 人 为 地 定义 ,或 者 是 基于 第 一 帧 图 像 
的 训练 样本 ,但 是 这 些 方法 在 所 跟踪 的 目标 发 生 外 观 变化 时 就 容易 导致 跟踪 失败 。 
在 复杂 的 现实 场景 中 ,一 个 自 适应 的 外 观 模型 是 获得 稳健 的 跟踪 性 能 的 关键 。 近 
年 来 ,尽管 基于 生成 模型 (Generative Model) 和 判别 模型 (Discriminative Model) 的 
视觉 跟踪 算法 在 目标 外 观 发 生变 化 时 能 够 比较 有 效 地 实现 自 适应 的 跟踪 ,但 是 当 
目标 外 观 发 生 显著 变化 时 ,如 何 更 加 有 效 地 实现 稳健 的 视觉 跟踪 至 今 仍 是 一 项 富 
有 挑战 性 的 研究 课题 。 

作为 计算 机 视觉 领域 的 经 典 的 、 核 心 的 研究 内 容 之 一 ,视觉 跟踪 技术 融合 
了 图 像 处 理 与 理解 、 模 式 识 别 、. 机 器 学 习 以 及 计算 机 软 硬 件 等 众多 学 科 领 域 的 
方法 与 技术 。 计 算 机 视觉 研究 具有 较 高 的 科学 价值 和 广阔 的 应 用 前 景 ,而 视 
觉 跟踪 是 计算 机 视觉 研究 领域 的 基础 和 关键 环节 之 一 ,是 该 领域 中 更 高 层次 
(如 行为 分 析 、 理 解 等 ) 研 究 的 基础 。 综 上 所 述 , 对 于 视觉 跟踪 技术 的 研究 ,来 
源 于 计算 机 视觉 应 用 领域 的 实际 需求 。 为 了 解决 这 一 课题 ,需要 进一步 探索 
更 为 有 效 的 视觉 跟踪 方法 和 技术 。 因 此 ,本 课题 的 研究 具有 重要 的 学 术 和 应 
用 价值 。 
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视觉 跟踪 在 计算 机 视觉 的 相关 领域 得 到 了 广泛 的 研究 和 应 用 。 在 智能 视频 监 
控 领域 ,伯克利 的 视觉 研究 组 在 20 世纪 90 年 代 开展 了 初步 的 研究 工作 ,提出 了 多 
个 有 效 的 ,能 够 初步 处 理 遮挡 问题 的 车 辆 跟踪 算法 。 同 时 期 ,在 智能 机 器 人 研究 领 
域 ,卡耐基 梅 隆 大 学 机 器 人 研究 所 提出 了 智能 控制 和 视觉 技术 相 结合 的 视觉 跟踪 
方法 。 在 视频 分 析 领 域 , 麻 省 理工 学 院 媒体 实验 室 提 出 了 体育 视频 中 多 目标 跟踪 
方法 。 在 智能 人 机 交互 领域 ,伊利 诺 伊 大 学 香槟 分 校 在 目标 识别 .行为 分 析 和 视觉 
跟踪 方面 开展 了 一 些 卓有成效 的 工作 。 近 年 来 ,澳大利亚 格拉 斯 理工 大 学 的 计算 
机 图 形 与 视觉 研究 所 ,以 及 苏黎世 联邦 高 等 工业 大 学 的 视觉 研究 组 在 视觉 跟踪 领 
域 开展 了 基于 在 线 学 习 外 观 模型 的 研究 工作 ,并 取得 了 一 些 具 有 重要 影响 的 成 果 。 
此 外 ,在 国内 ,一 些 高 校 和 研究 机 构 近 年 来 也 在 视觉 跟踪 领域 陆续 开展 了 这 方面 的 
研究 工作 ,这 些 研究 机 构 包 括 中 科 院 自动 化 所 、 中 科 院 计算 所 、 清 华 大 学 、 北 京 大 
学 ,西安 交通 大 学 ,哈尔滨 工业 大 学 和 华中 科技 大 学 等 。 

近年 来 ,视觉 跟踪 问题 已 成 为 计算 机 视觉 领域 的 研究 热点 之 一 ,一 些 重要 的 国 
际 期 刊 和 国际 学 术 会 议 , 例 如 :IEEE Transactions on PAMI., IJCV. CVPR, IC- 
CV, ECCV 等 ,发 表 了 大 量 有 关 视 觉 跟 踪 方面 的 研究 论文 。 其 中 一 些 学 术 会 议 就 
视觉 跟踪 问题 组 织 了 专门 的 工作 组 进行 技术 讨论 。 如 前 所 述 , 视 觉 跟踪 之 所 以 引 
起 如 此 广泛 的 关注 ,主要 是 由 于 它 能 够 广泛 应 用 于 社会 生产 生活 的 诸多 领域 。 

视觉 跟踪 的 研究 内 容 涉及 目标 表示 ,特征 选择 .外 观 建 模 、 目 标 检测 识别 、 滤 波 
技术 、 最 优化 方法 和 随机 采样 方法 等 众多 相关 领域 的 理论 方法 和 实现 技术 ,具有 较 
高 的 研究 难度 和 挑战 性 。 本 节 首 先 对 视觉 跟踪 的 基本 方法 和 技术 进行 简要 的 分 类 
与 总 结 , 然 后 对 视觉 跟踪 领域 的 主要 研究 工作 进行 回顾 与 评述 。 


1.2.1 目标 表示 ,特征 选择 与 外 观 建 模 


在 视觉 场景 中 ,被 跟踪 目标 的 形状 和 外 观 建 模 是 视觉 跟踪 的 基础 与 关键 。 表 
示 模 型 的 优 劣 对 跟踪 算法 的 性 能 有 重要 影响 。 目 标的 形状 表示 方法 可 以 大 致 归纳 
为 如 下 几 种 中 。 

(1) 使 用 单个 点 中 或 一 组 点 外 表示 目标 。 当 被 跟踪 目标 在 图 像 中 占有 较 小 区 
域 的 时 候 , 这 种 表示 方法 虽然 简单 ,但 通常 也 比较 有 效 。 
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(2) 使 用 矩形 框 或 椭圆 外 表示 目标 。 这 种 表示 方法 在 视觉 跟踪 研究 中 最 为 常 
见 , 其 特点 是 比较 适合 目标 的 仿 射 变换 与 射影 变换 ,可 以 用 来 近似 地 表示 刚性 目标 
与 非 刚 性 目标 。 

(3) 使 用 轮廓 中 表示 目标 。 轮 廓 通常 应 用 在 复杂 非 刚性 目标 的 视觉 跟踪 ,在 
这 种 情况 下 简单 的 几何 形状 难以 有 效 地 表示 目标 的 轮廓 。 

(4) 基于 部 件 或 骨架 的 目标 表示 5 。 具 有 关节 特性 的 目标 可 以 认为 它 是 由 关 
节 或 部 件 链接 在 一 起 的 ,这 种 表示 方法 便于 结合 特定 的 运动 模型 ,对 具有 关节 体 的 
运动 目标 进行 精确 的 跟踪 。 此 外 ,骨架 模型 可 以 用 来 表示 刚性 和 非 刚 性 目标 , 它 通 
常 通过 图 像 变 换 从 目标 轮廓 内 部 区 域 中 提取 而 得 到 。 

给 定 目标 表示 方式 选择 恰当 的 图 像 特征 来 刻画 被 跟踪 目标 ,在 视觉 跟踪 中 具 
有 重要 的 作用 。 特 征 选择 通常 是 面向 问题 的 ,“ 好 ”的 特征 通常 应 具备 较 好 的 区 分 
性 或 判别 力 。 特 征 的 选择 通常 依赖 于 特定 的 目标 表示 方法 。 例 如 ,颜色 用 来 作为 
基于 直方 图 的 外 观 表 示 的 特征 。 而 对 于 基于 轮廓 的 目标 表示 方法 ,边缘 通常 用 来 
作为 相应 的 特征 。 通 常 ,跟踪 算法 使 用 若干 特征 的 组 合 。 视 觉 跟踪 中 通常 采用 的 
基本 的 特征 如 下 [9 。 

1. 目标 的 颜色 

在 计算 机 视觉 领域 ,RGB 颜色 空间 是 最 为 常用 的 ,此 外 还 有 Lab 颜色 空间 和 
HSV 颜色 空间 也 较为 常用 。 这 三 种 颜色 空间 的 差别 在 于 :RGB 对 人 有 眼 的 色彩 感 
知 上 是 非 均匀 分 布 的 ,各 个 分 量 之 间 并 不 独立 ; 相 比 RGB 空间 ,Lab 颜色 空间 是 感 
知 均 匀 的 ,而 HSV 颜色 空间 是 感知 近似 均匀 的 。 总 而 言 之 ,这 几 种 颜色 空间 在 视 
觉 跟踪 领域 的 应 用 都 在 一 定 程 度 上 依赖 于 特定 的 问题 和 任务 ,并 不 存在 一 种 颜色 
空间 对 所 有 问题 是 普遍 适用 的 。 

2. 目标 的 边缘 

在 图 像 处 理 领 域 ,通常 利用 目标 在 边界 处 的 强度 的 显著 变化 来 检测 目标 的 边 
缘 " 下 。 边 缘 特征 一 般 对 场景 光照 变化 不 敏感 ,这 个 特性 对 于 视觉 跟踪 来 说 非常 重 
要 。 常 用 的 边缘 检测 算 子 包括 Canny 算 子 Sobel 算 子 和 Laplacian 算 子 等 。 

3. 目标 的 纹理 

一 般 认为 ,纹理 是 图 像 局 部 亮度 变化 特性 的 一 种 描述 ,这 种 特性 包括 规则 性 或 
平滑 性 由。 与 颜色 特征 不 同 ,纹理 特征 对 于 场景 光照 变化 不 敏感 。 常 用 的 纹理 描 
述 有 多 种 ,包括 : 灰 度 共生 和 矩阵 、Laws 纹理 描述 子 和 小 波 等 。 

4. 光 流 场 

光 流 特征 在 计算 机 视觉 以 及 图 像 处 理 中 有 着 广泛 的 应 用 , 它 与 运动 检测 和 运 
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动 估计 密切 相关 。 在 物理 中 ,运动 可 以 用 运动 场 描述 ;而 在 一 个 图 像 平 面 上 , 目标 
的 运动 往往 是 通过 图 像 序列 中 不 同 像素 点 的 灰 度 强度 分 布 的 变化 来 体现 的 。 空 间 
中 的 运动 场 变换 到 图 像 平 面 上 就 成 为 了 光 流 场 。 计 算 光 流 的 经 典 方法 包括 :Lu- 
cas-Kanade 7; i? , Horn-Schunck 方法 中 等 。 

此 外 ,在 视觉 跟踪 领域 常用 的 目标 特征 还 包括 :梯度 方向 直方 图 (Histogram 
of Oriented Gradient, HOG)" ,局 部 二 元 模式 (Local Binary Pattern, LBP)U7, 
尺度 不 变 特 征 变换 (Scale-Invariant Feature Transform, SIFT)U9 等 。 一 般 情况 
下 ,用 于 视觉 跟踪 的 特征 的 选择 是 依赖 于 特定 跟踪 任务 的 ,不 同 的 跟踪 问题 需要 人 
为 地 选择 合适 的 特征 或 特征 组 合 。 近 年 来 ,自动 的 特征 选择 在 视觉 跟踪 领域 得 到 
TTY EEO), SEF AdaBoost 方法 的 在 线 特征 选择 是 此 类 方法 的 典型 
代表 。 

基于 目标 表示 方式 和 选 定 的 特征 (集合 ), 用 于 视觉 跟踪 的 目标 外 观 模型 包括 
如 下 几 种 。 

1. 模板 

模板 (Template) 是 视觉 跟踪 中 最 为 常用 的 外 观 表 示 方 法 。 它 一 般 使 用 简单 的 
几何 形状 (如 椭圆 .矩形 等 ) 来 表示 中。 特定 设计 的 模板 ,例如 基于 分 块 表示 的 模 
板 中 ,可 以 同时 包含 目标 的 空间 和 外 观 (颜色 等 特征 ) 信 息 。 

2. 概率 分 布 

目标 外 观 的 概率 分 布 是 另 一 种 较为 常用 的 外 观 表 示 方 式 。 参 数 化 的 概率 分 布 
表示 可 以 采用 单个 高 斯 分 布 55 或 混合 高 斯 分 布 2 ;而 非 参数 的 表示 方式 主要 是 核 
HERE ATES, 

3. 主动 外 观 模型 

在 主动 外 观 模型 (Active Appearance Model, AAMD)60 中 ,目标 的 形状 由 一 组 
特征 点 来 描述 ,这 组 特征 点 位 于 目标 边界 或 目标 区 域内 部 。 每 一 个 特征 点 对 应 于 
一 个 外 观 特征 (颜色 .边缘 ` 纹 理 等 ) 向 量 。AAM 主要 特点 在 于 它 同 时 把 目标 的 形 
状 和 外 观 特征 模型 化 。 

4. 多 视 外 观 模型 

在 复杂 的 场景 中 , 当 运 动 目 标的 外 观 变 化 较 大 且 遮 挡 频 繁 发 生 时 ,采用 多 摄像 
机 的 多 视角 (multi-view) 跟 踪 是 个 不 错 的 选择 。 与 此 相对 应 的 多 视 外 观 模 型 ,用 来 
模型 化 目标 的 不 同 视 角 。 多 视 外 观 模 型 通常 考虑 从 不 同 视角 的 样本 中 生成 一 个 子 
空间 59 ,或 者 考虑 从 不 同 视角 的 样本 中 训练 得 到 一 个 判别 分 类 器 5 。 


1.2.2 视觉 跟踪 方法 


前 面 的 章节 已 经 对 目标 表示 和 外 观 建 模 做 了 简要 的 归 类 和 介绍 。 概 括 地 说 ， 
视觉 跟踪 问题 可 以 分 解 为 :目标 表示 、 外 观 建 模 和 跟踪 框架 (方法 ) 。 在 视觉 跟踪 研 
究 领域 ,外 观 建 模 通 常 分 为 :前 景 建 模 和 前 景 背景 联合 建 模 。 与 此 相对 应 的 外 观 模 
型 可 以 归结 为 两 大 类 :原生 模型 和 判别 模型 。 原 生 模型 试图 构建 一 个 紧凑 的 外 观 
模型 来 描述 可 能 的 目标 外 观 变 化 。 判 别 模型 不 同 于 原生 模型 , 旨 在 将 目标 外 观 与 
背景 区 分 开 来 。 大 多 数 判别 外 观 模型 是 通过 机 器 学 习 的 方法 学 习 一 个 两 类 分 类 器 
(Binary Classifier) 来 区 分 跟踪 的 目标 和 背景 。 至 于 跟踪 框架 (方法 ) ,大 致 可 以 归 
类 为 :确定 性 的 跟踪 方法 和 基于 采样 的 随机 跟踪 方法 两 种 。 在 视觉 跟踪 应 用 中 , 跟 
踪 方 法 通常 与 外 观 建 模 方式 有 关 。 在 这 一 节 里 ,我 们 对 视觉 跟踪 的 主要 方法 做 一 
个 简要 的 回顾 与 总 结 。 

1. 原生 外 观 模型 

1) 基于 目标 模板 

目标 模板 既 可 反映 目标 的 空间 信息 ,也 可 包含 目标 特征 (颜色 ,纹理 等 ) 信 息 。 
在 基于 模板 的 视觉 跟踪 研究 方面 , 较 早期 的 工作 是 1981 年 Lucas 和 Kanade!” 的 
图 像 配 准 方法 。 这 一 开创 性 研究 工作 的 基本 思路 是 :将 首 帧 图 像 的 目标 区 域 ( 矩 
形 ) 设 定 为 模板 ,在 后 续 的 图 像 序列 帧 中 搜寻 与 设 定 模板 匹配 度 最 高 的 区 域 。 采 用 
的 匹配 准则 是 目标 模板 和 候选 矩形 区 域 对 应 像素 灰 度 值 差 的 平方 和 (Sum of 
Squared Differences,SSD) 。 在 文献 [28] 中 ,只 能 获得 平移 运动 参数 的 Lucas 一 Ka- 
nade 方法 被 扩展 到 可 以 获得 仿 射 变换 参数 ,并 应 用 于 特征 点 跟踪 。 在 这 一 研究 工 
作 中 ,作者 还 提出 了 在 评估 特征 点 质量 的 方法 :计算 当前 帧 特征 点 与 首 帧 特征 点 的 
不 相似 度 , 当 不 相似 度 大 于 一 定 国 值 时 认为 该 特征 点 不 再 可 靠 进而 被 丢弃 。Shi 和 
Tomasif9 认 为 ,一 个 “好 ”的 特征 点 的 选择 取决 于 这 一 特征 点 是 否 能 给 跟踪 算法 带 
来 更 好 的 跟踪 性 能 。 此 外 ,Baker 和 Matthews"? 对 经 典 的 Lucas-Kanade 方法 做 
了 全 面 的 回顾 ,并 对 该 框架 下 的 各 种 算法 进行 了 较为 全 面 的 评述 。 

视觉 跟踪 过 程 中 使 用 静态 不 变 的 外 观 模 板 是 不 可 行 的 ,这 是 因为 目标 外 观 在 
视觉 场景 中 受 各 种 内 部 或 外 在 因素 影响 而 不 断 变 化 。 因 而 ,为 了 获得 稳健 的 跟踪 
性 能 ,模板 更 新 是 一 个 必须 考虑 的 重要 问题 。 一 种 非常 简单 的 更 新 策略 是 使 用 当 
前 跟踪 的 结果 对 目标 模板 进行 更 新 。 这 一 更 新 策略 的 问题 在 于 跟踪 过 程 中 误差 累 
积 将 最 终 导致 目标 漂移 (Drifting) 并 导致 跟踪 失败 。 针 对 这 一 问题 ,Matthews 等 
人 呈 给 出 了 一 种 解决 模板 更 新 问题 的 方案 :在 跟踪 过 程 中 保留 首 帧 的 模板 ,用 当 
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前 帧 的 跟踪 结果 对 目标 模板 进行 更 新 ,并 和 首 帧 模板 进行 对 齐 。 在 文献 [31] 中 , 作 
者 提出 用 一 个 参数 模型 来 建 模 目 标的 运动 ,用 一 个 子 空 间 来 建 模 场景 中 目标 光照 
的 变化 ,用 稳健 估计 方法 来 建 模 目 标的 遮挡 。 此 外 , Nguyen 和 Smeulders?? £ft 
迹 挡 情况 下 的 模板 匹配 问题 进行 了 深入 的 研究 ,并 提出 对 目标 模板 中 的 每 一 像素 
分 别 调用 卡尔 曼 滤 波 器 进行 更 新 。 该 方法 对 于 场景 中 目标 光照 变化 具有 和 较 好 的 稳 
健 性 。 在 文献 [33j 中 ,Jepson 等 人 提出 了 一 种 可 以 处 理光 照 变化 和 外 观 变形 的 跟 
踪 方法 。 它 融合 目标 稳定 部 分 、 帧 间 差 别 部 分 和 噪声 影响 部 分 的 WSL 三 分 量 模 
型 。 该 方法 使 用 小 波 作为 目标 特征 ,采用 基于 在 线 的 EM 算法 更 新 模型 参数 。 在 
这 一 模型 中 ,目标 的 仿 射 运动 估计 是 通过 目标 稳定 分 量 进行 。 该 模型 的 主要 缺陷 
在 于 稳定 分 量 部 分 , 当 背 景 变化 较 缓 慢 时 ,部 分 背景 也 将 被 估计 成 目标 的 一 部 分 。 
同样 基于 在 线 估计 参数 的 方式 ,Han 和 Davis” 提出 使 用 高 斯 混合 模型 对 目标 区 
域内 的 像素 进行 在 线 建 模 。 在 该 模型 中 ,作者 通过 自 适应 带宽 的 Mean Shift 算法 
在 线 自动 估计 各 个 模型 参数 。 使 用 单一 目标 模板 的 跟踪 方法 在 实际 跟踪 任务 中 应 
用 广泛 ,但 在 目标 姿态 变化 较 大 时 往往 导致 跟踪 失败 。 

2) 基于 目标 特征 的 概率 分 布 

这 种 目标 外 观 建 模 方 法 通常 采用 目标 内 部 的 特征 (颜色 .边缘 等 ) 的 概率 分 布 
来 描述 目标 。 这 种 建 模 方法 的 主要 特点 在 于 它 忽 略 了 目标 区 域 的 空域 信息 ,因而 
能 用 于 处 理 目标 的 非 刚性 形变 。 这 方面 的 早期 研究 工作 包括 :Birchfieldc5 采 用 一 
个 椭圆 表示 人 脸 并 使 用 颜色 直方 图 对 人 脸 进行 跟踪 。 同 样 基于 颜色 直方 图 表示 ， 
Comaniciu 等 人 中 结 合 核 密度 估计 方法 ,在 计算 颜色 直方 图 时 使 用 核 函数 对 直方 
图 进行 加 权 使 得 越 靠近 目标 中 心 的 像素 权重 越 大 ,从 而 在 一 定 程度 上 避免 了 哮 杂 
背景 的 干扰 。 此 外 ,作者 还 提出 了 处 理 目 标尺 度 变化 的 方法 , 它 通 过 对 当前 跟踪 得 
到 的 尺度 进行 一 定 范围 的 伸缩 (例如 ,5%,10% 等 ), 然 后 分 别 计算 相似 度 , 相 似 度 
最 大 的 作为 最 终 的 目标 尺度 。Comaniciu 等 人 的 方法 为 目标 (位 置 和 尺度 ) 跟 踪 提 
供 了 一 种 新 的 思路 。 该 方法 的 一 个 缺陷 是 基于 核 函 数 的 颜色 直方 图 并 不 能 很 好 地 
描述 目标 的 尺度 ,往往 在 匹配 时 小 尺度 比 大 尺度 具有 更 高 的 相似 度 , 从 而 造成 尺度 
跟踪 漂移 现象 。 之 后 ,Collins 中 提出 了 一 个 基于 尺度 空间 的 处 理 方法 。 该 方法 采 
用 一 个 尺度 核 函数 ,在 空间 位 移 和 尺度 变化 上 交替 迭代 调用 Mean Shift 算法 ,从 而 
获得 目标 的 空间 位 置 和 尺度 。 

在 使 用 颜色 直方 图 方面 ,Mean Shift 等 确定 性 跟踪 方法 在 多 模 复杂 场景 下 往 
往 易于 陷入 局 部 模式 从 而 导致 跟踪 失败 。 针 对 这 一 问题 ,在 文献 [38] 和 [39] 中 提 
出 了 结合 随机 跟踪 方法 和 颜色 直方 图 的 处 理 方案 。 在 文献 [38] 中 ,Pérez 等 人 提出 
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在 粒子 滤波 框架 下 基于 颜色 直方 图 的 跟踪 方法 ,该 方法 对 复杂 多 模 场 景 具有 一 定 
的 稳健 性 。 当 使 用 大 量 粒子 时 ,对 颜色 直方 图 的 计算 是 个 很 大 的 计算 负担 。 为 了 
减少 计算 代价 ,Poriklict 提出 使 用 积分 直方 图 。 与 此 类 似 ,Adam 4 A e h E 
用 基于 分 块 目标 表示 的 颜色 直方 图 ,其 中 每 一 个 子 块 都 用 颜色 直方 图 来 表示 。 基 
于 这 种 外 观 模型 的 跟踪 方法 对 局 部 遮挡 具有 和 较 好 的 稳健 性 。 此 外 ,文献 [42] 和 
[46] 还 给 出 了 处 理 更 多 运动 参数 (包括 位 移 ` 尺 度 .旋转 方向 等 ) 的 解决 方案 。 这 些 
方案 大 多 基于 椭圆 表示 的 颜色 直方 图 模型 ,采用 核 函 数 进行 跟踪 。 

对 于 非 刚 性 形变 的 目标 跟踪 ,基于 目标 特征 的 概率 分 布 的 跟踪 方法 能 够 获得 
较 好 的 跟踪 性 能 ,具有 一 定 的 稳健 性 。 不 过 ,当场 景 中 具有 多 个 相似 特征 的 目标 ， 
或 在 嗜 杂 的 背景 下 ,这 种 基于 概率 分 布 的 外 观 模 型 极 易 导 致 跟踪 漂移 和 失败 ,其 根 
本 原因 在 于 这 一 外 观 建 模 方式 忽略 了 目标 的 空间 分 布 信息 。 

3) 基于 子 空间 

基于 子 空间 的 跟踪 方法 通常 是 通过 训练 样本 学 习 ( 在 线 或 离线 ) 构 造 (通常 通 
过 主 成 分 分 析 ) 一 个 子 空间 模型 。 该 方法 的 主要 优点 在 于 它 同 时 兼顾 了 目标 的 光 
照 变化 与 姿态 变化 ,这 使 得 它 能 够 处 理 较为 复杂 场景 下 的 视觉 跟踪 任务 o 

基于 离线 构造 子 空 间 方 面 ,Black 和 Jepsonr'””1 给 出 了 多 视角 子 空间 构造 方法 。 
值得 注意 的 是 ,该 方法 通过 深入 分 析 光 流 计算 中 的 灰 度 强度 不 变 假设 ,提出 了 子 空间 
的 一 致 性 假设 。 作 者 认为 .多 视角 目标 观测 可 以 采用 相同 的 特征 基 ( 集 ) 进 行 重建 ,使 
得 重建 图 像 与 原始 图 像 具 有 一 致 的 灰 度 强度 分 布 。 基 于 这 一 假设 可 以 实现 不 依赖 于 
特定 视角 的 视觉 跟踪 任务 。 

确实 ,基于 离线 的 构造 方法 尽管 也 能 在 一 定 程度 上 描述 和 适应 目标 的 外 观 变 
化 ,但 是 基于 离线 的 方式 在 复杂 的 场景 中 往往 由 于 累积 的 跟踪 误差 而 导致 跟踪 漂 
移 。 针 对 这 一 问题 ,Ross 等 人 "提出 了 基于 在 线 学 习 渐进 构造 子 空 间 基 的 算法 。 
在 该 算法 中 , 子 空间 基 是 随 着 顺序 获得 的 外 观 样本 的 逐渐 增加 而 不 断 提升 其 准确 
性 的 。 作 者 的 实验 表明 ,该 算法 在 处 理 显著 的 光照 ,姿态 和 尺度 变化 等 方面 具有 较 
强 的 稳健 性 。 此 外 ,在 Log 欧 氏 黎 曼 度量 之 下 ,Li 等 全 提出 了 一 种 基于 SLAM 
模型 的 在 线 跟 踪 算 法 来 处 理 目 标 姿势 .尺度 自 适应 变化 的 情况 。Wnu 等 人 区 基于 
渐进 的 协 方差 张 量 学 习 提 出 了 一 种 姿势 和 外 观 自 适应 的 实时 跟踪 算法 。Li 等 
人 中 通过 自 适应 地 更 新 样本 均值 和 特征 基 , 渐 进 地 学 习 一 个 低 阶 张 量 特征 空间 表 
示 来 建 模 目 标的 外 观 模型 ,提出 了 一 种 在 线 的 张 量子 空间 学 习 算 法 来 实现 有 效 的 
目标 跟踪 。Yang 等 人 中 提 出 一 种 基于 子 空间 的 外 观 自 适应 策略 , 它 基 于 三 个 约 
东 , 即 负 样 本 数据 、 自 底 向 上 的 成 对 正 负 样本 数据 以 及 自 适应 的 目标 动力 学 特征 。 
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尽管 基于 子 空间 的 跟踪 方法 取得 了 较 好 的 跟踪 性 能 ,但 是 在 复杂 场景 下 构造 和 更 
新 子 空间 模型 以 实现 目标 的 自 适应 变化 仍然 是 个 极 富 挑战 性 的 问题 。 

2. 判别 外 观 模型 

相 比 原生 外 观 模型 只 对 目标 自身 进行 建 模 ,判别 外 观 模 型 同时 对 目标 和 背景 
进行 联合 建 模 ,因而 有 可 能 获得 较 好 的 区 分 目标 与 背景 的 判别 能 力 。 近 年 来 ,基于 
判别 外 观 模 型 的 视觉 跟踪 受到 了 国内 外 研究 人 员 的 广泛 关注 。 在 这 类 方法 中 , 视 
觉 跟踪 被 看 作 一 个 分 类 的 问题 。 换 句 话 说 ,在 每 一 帧 中 跟踪 器 的 任务 就 是 以 最 佳 
方式 区 分 目标 与 背景 。 

Avidant5 使 用 支持 向 量 机 (SVM) 离 线 训练 一 个 分 类 器 用 于 对 目标 与 背景 的 
分 类 ,实现 了 一 个 有 监督 的 目标 跟踪 器 。 该 方法 的 优点 是 :在 跟踪 阶段 由 于 不 用 在 
线 训练 分 类 器 因而 跟踪 速度 较 快 。 缺 点 是 由 于 分 类 器 是 事先 就 训练 获得 的 ,因而 
被 跟踪 目标 必须 是 事先 就 已 经 知道 的 ;此 外 ,在 跟踪 过 程 中 由 于 分 类 器 是 固定 不 变 
的 ,因而 它 很 难 适应 不 断 变化 的 背景 。 为 了 解决 这 一 缺陷 ,Collins 和 Liu 中 提出 一 
种 基于 在 线 特征 选择 的 自 适应 跟踪 方法 。 作 者 使 用 RGB 的 线性 组 合 为 特征 ,通过 
对 前 景 和 背景 点 的 采样 获得 它们 对 于 不 同 特征 组 合 的 分 布 情况 ,选择 最 有 判别 性 
的 特征 组 合生 成 置信 图 ,最 后 采用 Mean Shift 算法 进行 模式 定位 。 与 此 类 似 的 工 
作 包 括 :Yin 和 Collins555 在 文献 L51] 工 作 的 基础 上 ,提出 对 目标 的 背景 进行 分 割 ， 
然后 对 每 对 目标 和 背景 使 用 不 同 的 特征 ,然后 对 生成 的 置信 图 使 用 Mean Shift 算 
法 进行 目标 定位 。Wang 等 人 ! 汪 使 用 粒子 滤波 框架 自动 进行 特征 选择 ,并 在 粒子 
滤波 框架 下 实现 目标 的 随机 跟踪 。 

一 个 判别 模型 的 重要 工作 是 Aidan’) 提出 的 集成 学 习 (Ensemble Learning) 
框架 下 的 跟踪 方法 ,作者 采用 AdaBoost 算法 在 线 地 训练 获得 前 景 /背景 两 类 分 类 
器 ,并 用 获得 的 分 类 器 对 后 续 帧 进行 分 类 并 获得 一 张 置信 图 ,最 后 运用 Mean Shift 
算法 进行 目标 定位 。 作 者 也 讨论 了 如 何在 线 更 新 弱 分 类 器 以 训练 强 分 类 器 的 方 
案 , 以 适应 目标 外 观 与 背景 的 自 适应 变化 。Grabner 和 Bischof) iit T — Ap AEF 
在 线 Boosting 的 特征 选择 算法 实现 实时 的 目标 跟踪 。 这 类 基于 Boosting 的 判别 
外 观 模型 可 以 有 效 地 将 被 跟踪 目标 与 背景 区 分 开 来 ,然而 它 最 大 的 缺点 是 因 跟 踪 
过 程 中 跟踪 误差 的 不 断 累积 ,从 而 可 能 导致 跟踪 漂移 。 为 了 解决 跟踪 漂移 问题 ， 
Tang 等 人 5 提出 一 种 基于 联合 训练 (co-training) 框 架 在 不 同 的 特征 集 上 训练 多 
个 SVM 分 类 器 来 提高 外 观 的 判别 能 力 ; 同 样 基于 联合 训练 框架 ,Liu 等 人 [5 通过 
寻找 Boosting 错误 上 界 使 用 多 视 弱 假设 在 线 地 更 新 外 观 模 型 。Woodley 等 人 中 
提出 一 种 结合 原生 模型 和 判别 模型 的 跟踪 算法 。 尽 管 这 些 算 法 能 够 在 一 定 程度 上 
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缓解 跟踪 漂移 问题 ,但 是 在 复杂 场景 中 当 目 标 外 观 显著 变化 时 ,这 一 困难 并 没有 得 
到 很 好 的 解决 。 

值得 注意 的 是 , 当 更 新 自 适应 外 观 模型 时 ,如 何 选择 正 负 样 本 构建 训练 集 。 通 常 
的 策略 是 ,将 当前 跟踪 器 估计 的 目标 位 置 作为 正 样本 ,而 从 目标 周围 的 领域 中 选取 负 
样本 。 然 而 ,如 果 跟 踪 器 估计 的 目标 位 置 是 不 准确 的 ,那么 外 观 模型 将 会 以 这 个 不 准 
确 的 正 样本 对 模型 进行 更 新 。 随 着 跟踪 的 进行 ,这 种 方法 会 使 模型 的 判别 性 能 严重 
下 降 , 并 且 将 可 能 导致 跟踪 漂移 。 

如 果 使 用 固定 的 判别 分 类 器 进行 目标 跟踪 ,那么 它 将 会 有 效 地 避免 跟踪 漂移 
问题 ,但 是 它 缺 乏 必要 的 外 观 自 适应 能 力 。 同 样 地 ,如 果 使 用 在 线 的 自 适应 外 观 模 
型 ,那么 可 能 会 导致 跟踪 漂移 问题 。 这 似乎 是 个 两 难 的 问题 ,因而 ,如 何 有 效 地 避 
免 跟踪 漂移 问题 同时 还 能 保留 在 线 的 自 适应 能 力 ,已 成 为 近年 来 外 观 模型 研究 的 
热点 方向 。 

最 近 ,Grabner 等 人 5 中 将 半 监 督学 习 引 入 到 视觉 跟踪 问题 ,基于 SemiBoosc^? 
算法 ,他 们 提出 了 一 个 基于 半 监 督学 习 的 在 线 分 类 器 实现 稳健 的 目标 跟踪 。 该 方 
法 从 先 验 信息 (例如 ,使 用 第 一 帧 中 初始 的 目标 状态 ) 获 得 标记 样本 (Labeled Sam- 
ple) ,而 未 标记 样本 (Unlabeled Sample) 则 是 从 跟踪 过 程 中 获得 的 。 基 于 半 监 督学 
2] BUR ,从 跟踪 过 程 获得 的 未 标记 样本 集 能 够 帮助 跟踪 器 学 习 一 个 在 线 自 适 应 的 
外 观 模 型 ,而 仅 从 先 验 信息 中 构建 标记 样本 集 则 能 够 有 效 地 克服 跟踪 漂移 问题 。 

在 基于 半 监 督学 习 的 判别 外 观 模型 中 5 ,标记 样本 只 来 自 于 初始 的 第 一 帧 图 
像 , 而 后 续 训练 样本 不 被 标记 。 这 种 方法 在 目标 完全 离开 视觉 场景 ,或 者 出 现 遮 挡 
时 表现 出 良好 的 判别 性 能 ,但 是 在 帧 间 运 动 较 小 的 情况 下 ,一 些 有 用 的 信息 ,例如 
运动 连续 性 信息 并 没有 得 到 很 好 的 利用 。Barbenko 等 人 [中 提出 了 基于 多 示例 学 
3J (Multiple-Instance Learning，MIL) 的 外 观 模 型 更 新 算法 实现 对 目标 的 稳健 跟 
踪 。 事 实 上 ,基于 MIL 学 习 的 跟踪 方法 受到 Viola GAC HE IEF MIL 学 习 
的 目标 检测 方法 的 启发 。 通 常 , 目 标 检测 存在 一 些 固 有 的 歧义 性 ,这 种 歧义 性 使 得 
仅仅 通过 传统 方法 训练 分 类 器 显得 困难 重重 。 基 于 这 个 原因 , Viola 4 AT 提出 
了 运用 多 实例 学 习 方法 进行 目标 检测 。 在 MIL 的 训练 过 程 中 ,实例 是 以 集合 ,或 
PHE bag) ”的 形式 呈现 ,并 且 标 记 是 以 包 而 不 是 个 体 实例 而 体现 。 如 果 一 个 包 
被 标记 为 正 的 ,那么 认为 这 个 包 至 少 包含 一 个 正 实例 ,否则 这 个 包 就 被 认为 是 负 
的 。 较 之 目标 检测 ,目标 跟踪 具有 更 多 的 歧义 性 :这 是 由 于 跟踪 器 没有 人 为 的 干预 
输入 同时 需要 自我 引导 。 因 而 从 理论 上 说 ,将 MIL 技术 应 用 于 目标 跟踪 问题 比 将 
其 用 于 目标 检测 问题 更 为 适合 。 此 外 ,为 了 实现 一 个 更 为 稳健 的 跟踪 算法 ,Zeisl 
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等 人 [中 基于 半 监 督 Boosting 的 方法 设计 了 一 个 在 线 MIL 跟踪 算法 。 他 们 在 多 种 
具有 挑战 性 的 跟踪 测试 集 上 进行 的 实验 表明 ,与 当前 同类 算法 相 比 ,该 算法 可 以 获 
得 更 加 稳健 和 稳定 的 视觉 跟踪 。 

3. 基于 确定 性 的 跟踪 方法 

从 方法 论 的 角度 看 ,视觉 跟踪 的 研究 方法 可 以 归结 为 自 底 向 上 (bottom-up) 和 
自 顶 向 下 (top-down) 的 两 种 思路 。 自 底 向 上 的 方法 通常 不 依赖 于 先 验 知识 ,而 是 
通过 可 靠 的 检测 (Detection) 直 接 从 视觉 场景 中 获取 目标 的 相关 信息 并 用 于 视觉 跟 
踪 。 自 顶 向 下 的 方法 也 称 为 模型 驱动 (Model Driven) 的 方法 ,最 典型 的 例子 是 线 
性 或 非 线性 的 状态 空间 (State Space) 模 型 的 方法 , 它 通常 是 在 贝 叶 斯 框架 下 ,通过 
给 定 的 先 验 分 布 和 观测 模型 ,和 代 的 求解 后 验 分 布 进而 实现 目标 状态 的 估计 。 此 
外 ,也 有 一 些 研 究 工作 将 这 两 种 研究 思路 相 结 合 。 对 应 于 自 底 向 上 和 自 顶 向 下 的 
两 种 研究 思路 , 现 有 的 视觉 跟踪 算法 大 抵 可 以 分 为 两 大 类 :确定 性 跟踪 方法 和 基于 
采样 的 随机 跟踪 方法 。 

确定 性 跟踪 方法 一 般 利 用 自 底 向 上 的 底层 视觉 信息 提供 的 可 靠 检测 结果 ,并 
使 用 迭代 的 优化 技术 555 或 线性 规划 方法 5 实现 快速 的 目标 跟踪 。 这 些 自 底 向 上 
的 视觉 信息 包括 前 面 章 节 所 述 的 目标 特征 , 即 Haar-like 特征 .颜色 直方 图 、 梯 度 方 
向 直方 图 CHOG) 、 边 缘 方 向 直方 图 (EOG) ,尺度 不 变 的 特征 变换 (SIFT) 等 。Mean 
Shift 技术 被 广泛 地 应 用 于 视觉 跟踪 领域 bs ,是 确定 性 跟踪 方法 的 典型 代 
表 。 作 为 一 种 基于 非 参 数 优化 的 跟踪 算法 , 它 独立 于 目标 特征 且 具 有 收敛 速度 快 、 
计算 复杂 度 低 等 优点 。Cheng' 曾 明了 Mean Shift 本 质 上 是 个 自 适应 步 长 的 梯度 
下 降 算法 。Fashing 和 Tomasi” 进一步 指出 Mean Shift 和 Newton-Raphson ff 
化 算法 的 内 在 关联 。 自 从 Comaniciu 等 人 中 首次 将 Mean Shift 引入 到 视觉 跟踪 
领域 ,至 今 学 者 们 提出 了 许多 改进 的 Mean Shift 跟踪 算法 ,包括 :Elgammal 等 
人 中 提出 在 目标 区 域 中 融合 空间 结构 信息 的 Mean Shift 跟踪 算法 ,克服 了 忽略 空 
间 分 布 信息 的 颜色 直方 图 跟踪 方式 的 缺陷 ;在 文献 [43] 中 ,作者 基于 多 个 空域 分 布 
核 函数 提出 了 一 种 能 精确 地 估计 目标 尺度 和 方向 的 跟踪 算法 ;Fan ACY 4 d — 
个 基于 核 跟 踪 的 相似 度 度量 的 理论 分 析 ,并 探讨 了 避免 在 核 跟踪 算法 中 产生 奇异 
性 的 核 函数 设计 准则 与 基本 策略 。 尽 管 基于 Mean Shift 的 确定 性 跟踪 方法 取得 了 
很 大 的 成 功 ,但 是 这 种 方法 通常 要 求 相 继 的 两 帧 之 间 目 标的 位 移 较 小 。 其 主要 原 
因 在 于 Mean Shift 算法 容易 受到 多 模 场 景 中 背景 噪声 等 因素 干扰 而 陷入 局 部 最 优 
状态 ,从 而 导致 跟踪 失败 。 

鉴于 Mean Shift 跟踪 算法 的 局 部 优化 本 质 ,一 些 学 者 提出 结合 全 局 采样 与 局 
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部 优化 的 策略 实现 对 快速 运动 目标 的 跟踪 。Shan 等 人 "9 通过 使 用 颜色 和 运动 信 
息 ,将 Mean Shift 局 部 优化 过 程 认 入 到 粒子 滤波 框架 实现 对 手 的 实时 跟踪 ,作者 的 
实验 表明 这 种 结合 大 大 降低 了 随机 跟踪 所 需 的 粒子 数目 ,并 从 理论 上 分 析 了 如 何 
确保 在 使 用 局 部 优化 之 后 粒子 集 仍 能 近似 地 服从 真实 后 验 分 布 。 基 于 类 似 的 思 
路 ,Shen 等 人 [提出 在 多 带宽 Mean Shift 跟踪 框架 下 引入 模拟 退火 思想 ,渐进 地 
平滑 化 代价 (能 量 ) 函 数 表面 ,从 而 最 终 获得 全 局 最 佳 模式 。 使 用 一 个 大 带宽 过 度 
平滑 化 核 密 度 函 数 通 常 使 得 密度 分 布 具有 较为 简单 的 单 模 (Unimodal) 特性。 在 
退火 过 程 中 ,缓慢 地 逐渐 减 小 带宽 ,并 调用 Mean Shift 过 程 迭代 地 最 小 化 代价 函 
数 。 理 论 上 ,只 要 这 个 带宽 减 小 过 程 足够 缓慢 ,算法 最 终 将 会 收敛 到 全 局 最 优 
模式 。 

对 于 运动 具有 极 大 不 确定 性 的 目标 跟踪 问题 ,确定 性 的 跟踪 方法 容易 跟踪 失 
败 并 且 很 难 从 错误 状态 中 恢复 。 尽 管 结合 随机 采样 或 模拟 退火 过 程 的 Mean Shift 
算法 能 够 在 一 定 程度 上 提高 跟踪 的 稳健 性 ,但 在 处 理 复杂 多 模 分 布 的 问题 时 仍然 
难以 取得 令 人 满意 的 跟踪 性 能 。 

4. 基于 随机 采样 的 跟踪 方法 

不 同 于 确定 性 的 跟踪 方法 ,基于 随机 采样 的 概率 跟踪 方法 能 有 效 地 实现 在 多 
模 分 布 场景 下 的 视觉 跟踪 任务 。 这 类 方法 通常 是 在 基于 贝 叶 斯 跟踪 框架 下 ,通过 
状态 预测 与 观测 似 然 迭 代 地 估计 后 验 分布 实 现 对 目标 状态 的 估计 。 在 运动 模型 与 
观测 度量 呈 线 性 ,噪声 服从 高 斯 分 布 的 情况 下 ,卡尔 曼 滤波 5 可 以 获得 贝 叶 斯 滤 
波 的 精确 解析 解 。 对 于 非 高 斯 条 件 下 的 非 线性 系统 ,通常 是 使 用 蒙特 卡 洛 模拟 技 
术 来 实现 迭代 的 贝 叶 斯 滤波 。 粒 子 滤波 中 是 此 类 跟踪 方法 的 典型 代表 。 它 通过 一 
个 加 权 的 粒子 集 近似 地 表示 滤波 分 布 ,其 中 粒子 是 从 滤波 分 布 的 状态 空间 中 随机 
采样 的 ,后 验 的 更 新 则 依赖 于 粒子 的 序 贯 传播 ,粒子 权重 通过 观测 似 然 进行 更 新 。 
在 实际 的 粒子 滤波 应 用 中 ,通常 需要 考虑 跟踪 精确 性 与 计算 代价 (所 需 粒子 数目 ) 
的 平衡 。 一 般 情况 下 ,使 用 大 量 的 粒子 能 够 很 好 地 近似 复杂 的 滤波 分 布 ,但 是 高 兄 
的 计算 代价 往往 使 跟踪 算法 不 能 满足 实际 的 跟踪 需要 。 

一 般 来 说 ,直接 从 后 验 (滤波 ) 分 布 采样 是 比较 困难 的 。 在 状态 空间 中 有 效 的 
采样 策略 对 于 粒子 滤波 算法 来 说 至 关 重 要 。 从 这 个 角度 看 ,粒子 滤波 算法 可 以 分 
为 :重要 性 采样 "9, 因子 采样 中 ,以 及 拒绝 采样 "外 等 。 重 要 性 采样 的 基本 出 发 点 
在 于 尽 可 能 从 样本 空间 中 靠近 后 验 模式 的 区 域 采 样 。 为 了 达到 这 个 目的 ,重要 性 
采样 方法 通常 需要 使 用 一 个 易于 采样 ,而 且 其 分 布 靠近 后 验 模 式 的 提议 分 布 (Pro- 
posal Distribution) 。 对 于 贝 叶 斯 滤波 问题 ,重要 性 采样 的 关键 在 于 如 何 选取 提议 
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分 布 。 序 贯 重要 性 采样 (Sequential Importance Sampling，SIS) 是 最 为 常用 的 一 种 
解决 贝 叶 斯 滤波 问题 的 算法 , 它 通过 先前 时 间 阶 (Time Step) 估 计 得 到 的 后 验 密度 
迭代 的 产生 提议 分 布 。 序 贯 重 要 性 采样 算法 的 缺点 在 于 粒子 退化 问题 "9 ,也 就 是 
说 ,一 旦 提议 分 布 与 实际 滤波 分 布 的 形状 匹配 不 佳 ,大 部 分 粒子 的 权重 将 变 得 很 
小 ,这 些 粒子 在 传播 过 程 中 其 影响 将 逐渐 趋 于 零 .这 将 导致 大 量 的 计算 代价 浪费 在 
低 权重 的 粒子 上 。 另 一 方面 ,因子 采样 算法 的 缺陷 在 于 样本 贫 化 (Sample Impov- 
erishment) 现 象 , 即 多 个 样本 落 在 样本 空间 中 的 同一 点 ,导致 样本 集 缺 乏 多 样 性 
(Diversity) 。 

通过 在 状态 空间 中 维持 多 个 假设 ,粒子 滤波 算法 能 够 比较 有 效 地 处 理 多 模 分 
布 问 题 。 作 为 一 个 一 般 性 的 通用 跟踪 框架 ,尽管 它 在 视觉 跟踪 领域 取得 了 很 大 成 
功 ,但 是 粒子 滤波 算法 本 身 在 处 理 高 维 状 态 空间 的 跟踪 问题 时 仍然 具有 局 限 性 ( 样 
本 贫 化 等 )。 为 了 克服 这 一 局 限 性 ,一 些 研究 人 员 尝 试 通过 多 种 途径 来 进一步 改进 
粒子 采样 效率 。 近 年 来 ,将 密度 估计 方法 引入 到 粒子 滤波 框架 成 为 了 提高 粒子 采 
样 效 率 的 有 效 途径 之 一 5 。Cham 和 Rehg59 使 用 一 个 分 片 的 高 斯 模型 (Piece- 
wise Gaussian) 来 表示 观测 似 然 度量 和 先 验 预测 密度 ,从 而 获得 后 验 密度 的 解析 计 
算 方式 ,实现 多 假设 跟踪 。Vermaak 55: AC? 则 直接 将 后 验 密度 建 模 为 高 斯 混合 模 
型 ,作者 指出 后 验 密度 的 传播 可 以 通过 对 混合 模型 的 单个 成 分 (Component) 独 立 
地 进行 滤波 ,每 个 成 分 都 获得 一 定数 目的 粒子 ,以 此 实现 多 假设 跟踪 。Han 等 
人 中 将 核 密度 估计 技术 引入 到 序 贯 贝 叶 斯 滤波 框架 实现 快速 的 后 验 密 度 解析 和 
估计 。 基 于 高 斯 混合 模型 假设 ,作者 首先 使 用 UT 变换 (Unscented Transform) 计 
算 先 验 密度 ;然后 从 观测 数据 中 通过 多 阶段 采样 和 密度 插值 的 方式 估计 观测 度量 
的 解析 形式 ;最 后 ,将 这 两 项 估计 值 相 乘 并 使 用 可 变 带宽 的 Mean Shift 算法 获得 后 
验 密度 的 光滑 近似 。 此 外 ,密度 估计 的 支持 向 量 (Support Vector) 方 法 也 在 序 贯 贝 
叶 斯 滤波 中 得 到 了 应 用 5 Baner jee 和 Burlinacs0 采 用 稀 朴 核 密度 估计 的 方法 计 
算 给 定 粒 子 集 的 先 验 密度 ,其 中 的 密度 估计 器 包括 支持 向 量 描述 (SVDD) 和 相关 
向 量 机 (RVMD)52 。 作 者 使 用 SVDD 算法 把 目标 分 布 表 示 为 一 个 线性 混合 核 函数 
(LME) ,结合 序列 的 观测 模型 迭代 地 给 出 后 验 分 布 的 闭合 形式 表示 。 在 粒子 滤波 
框架 中 采用 支持 向 量 的 方法 估计 密度 ,其 目的 是 获得 后 验 密度 的 稀 玻 表示 和 解析 
解 ,从 而 降低 粒子 滤波 的 计算 代价 。 

尽管 基于 密度 估计 的 技术 应 用 在 贝 叶 斯 滤波 有 助 于 简化 采样 问题 ,同时 在 采 
样 过 程 中 也 可 以 维持 多 个 假设 ,但 是 粒子 滤波 算法 仍然 受 限 于 高 昂 的 计算 代价 ,万 
其 是 在 复杂 滤波 分 布 条 件 下 需要 使 用 大 量 的 粒子 来 近似 后 验 分 布 。 为 了 降低 计算 


14 


第 1 章 绪论 《 


负担 从 而 提高 粒子 采样 效率 ,学 者 们 提出 了 多 种 粒子 滤波 改进 算法 。Deutcher 等 
人 !9 在 传统 的 粒子 滤波 跟踪 算法 (Condensation) 中 中 交错 地 使 用 一 个 模拟 退火 过 
程 。 模 拟 退 火 过 程 便于 从 平滑 化 的 后 验 分 布 采样 ,这 种 结合 使 抽取 的 样本 靠近 实 
际 的 后 验 模式 ,从 而 避免 采样 陷入 局 部 最 优 模式 。 通 过 在 一 个 高 维 状态 空间 中 关 
节 体 跟踪 (Articulated Body Tracking) 的 实验 ,作者 给 出 了 该 采样 方法 与 Conden- 
sation 算法 的 全 面 的 性 能 比较 分 析 。 该 方法 的 一 个 局 限 性 是 由 于 在 采样 中 调用 模 
拟 退火 算法 ,缓慢 的 退火 过 程 使 滤波 算法 的 计算 复杂 度 仍然 很 高 。Choo 和 
Fleet[ 轨 提出 在 序 贯 贝 叶 斯 框架 下 使 用 马尔 科 夫 链 蒙 特 卡 洛 (MCMC) 采 样 方法 替 
代 广 泛 采 用 的 重要 性 采样 算法 ,直接 从 后 验 分 布 采样 。 这 种 采样 方式 主要 是 通过 
一 个 合适 的 提议 分 布 (Proposal Distribution) 从 后 验 分 布 中 采样 ,以 此 构建 一 条 收 
敛 于 后 验 分 布 的 马 氏 链 。 相 比 与 传统 的 序 贯 重要 性 采样 算法 ,使 用 MCMC 采样 的 
好 处 在 于 可 以 更 高 效 地 从 后 验 分 布 中 采样 ,因而 可 以 使 用 较 少 的 粒子 来 近似 目标 
分 布 。 与 此 工作 类 似 ,Khan 等 人 器 提出 一 种 基于 MCMC 采样 的 粒子 滤波 算法 用 
于 多 目标 跟踪 。 作 者 直接 在 高 维 的 状态 空间 中 建 模 多 目标 状态 ,通过 引入 一 个 基 
于 马尔 科 夫 场 的 运动 先 验 来 描述 多 目标 跟踪 场景 下 目标 间 的 相互 影响 (Interac- 
tion) ,实现 在 高 维 状 态 空 间 中 的 MCMC 采样 。 此 外 ,为 了 处 理 可 变数 目的 多 目标 
跟踪 问题 ,作者 提出 使 用 可 逆 跳 跃 MCMC(RJMCMC) 建 模 可 变 维 状态 空间 中 的 后 
验 采 样 。 他 们 的 实验 表明 相 比 于 独立 的 多 个 粒子 滤波 实现 .使 用 MCMC 采样 替代 
序 贯 重要 性 采样 可 以 显著 地 减少 所 需 的 粒子 数目 ,从 而 降低 计算 复杂 度 。 紧 接着 ， 
Zhao 等 人 呵 提 出 采用 数据 驱动 (data-driven) 的 MCMC 采样 思路 替代 传统 的 MC- 
MC 方法 ,在 采样 过 程 中 更 有 效 地 估计 提议 分 布 , 使 产生 的 样本 更 靠近 样本 空间 中 
的 局 部 模式 ,从 而 提高 采样 效率 、 降 低 计算 复杂 度 。 

在 视觉 跟踪 研究 领域 ,已 有 的 大 多 数 跟踪 算法 都 基于 一 个 假设 , 即 目 标 运 动 
(状态 变化 ) 和 外 观 变 化 的 连续 性 。 然 而 ,在 一 些 复杂 的 场景 中 ,这 种 连续 性 假设 并 
不 符合 实际 情况 。 运 动 连续 性 假设 对 视觉 跟踪 至 关 重 要 ,这 是 由 于 这 个 假设 有 利 
于 跟踪 算法 可 以 在 较 小 的 状态 空间 中 建 模 目标 的 运动 ,使 在 有 限 的 计算 资源 条 件 
下 实现 可 靠 的 跟踪 任务 。 一 旦 这 种 连续 性 假设 不 再 成 立 ,那么 就 需要 在 状态 空间 
中 扩大 搜索 (采样 ) 范 围 来 估计 目标 的 状态 ,这 通常 需要 增加 大 量 的 样本 (粒子 或 迭 
代 ) 来 实现 在 庞大 的 方案 空间 中 进行 有 效 的 采样 。 

在 视觉 跟踪 领域 ,目标 运动 的 不 连续 性 (运动 突变 ) 主 要 包括 :目标 自身 动力 学 
特性 的 极 大 不 确定 性 ,外 在 因素 影响 的 动力 学 改变 ,摄像 机 镜头 切换 , 低 帧 率 视频 
等 。 较 早 对 目标 跟踪 中 的 运动 动力 学 特性 进行 研究 的 是 Blake 等 人 [ss ,他 们 从 
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特定 场景 的 训练 数据 中 学 习 动力 学 特征 并 用 于 动力 学 变化 的 状态 建 模 。 这 种 基于 
运动 特征 学 习 的 方法 对 于 具有 一 定 运动 模式 的 特定 场景 下 的 跟踪 被 认为 是 可 行 
的 。 然 而 由 于 基于 特定 的 训练 集 ,这 种 方法 很 难 适 合 于 一 般 性 目标 的 跟踪 ,因而 可 
扩展 性 较 差 ,难以 应 用 于 低 帧 率 视频 等 复杂 运动 条 件 下 的 视觉 跟踪 任务 。 多 尺度 
和 分 层 采样 的 策略 是 处 理 目标 运动 不 连续 问题 的 另外 一 种 方案 。 在 贝 叶 斯 框架 
F + Sullivan 等 人 结合 不 同 尺度 下 的 图 像 观测 ,提出 在 状态 空间 中 进行 有 效 搜索 
的 跟踪 方案 。 这 种 方法 的 缺点 是 ,大 尺度 下 的 不 准确 的 推断 将 导致 在 原始 尺度 下 
目标 搜索 的 失败 。 针 对 这 一 困难 ,Hua 等 人 5 提出 在 多 尺度 下 的 一 种 基于 动态 马 
尔 科 夫 网 络 (Dynamic Markov Network) 的 合作 搜索 策略 ,并 设计 了 一 个 序 贯 信念 
传播 (Sequential Belief Propagation ,SBP) 算 法 以 实现 更 为 准确 的 贝 叶 斯 推断 。 作 
者 的 实验 表明 ,这 种 方法 能 够 有 效 地 处 理 多 种 运动 不 确定 性 条 件 下 的 视觉 跟踪 
问题 。 

近年 来 ,一 些 研究 人 员 对 运动 突变 的 视觉 跟踪 问题 进行 了 深入 的 分 析 和 研究 。 
针对 低 帧 率 条 件 下 的 视觉 跟踪 问题 ,Li 等 人 [加 提出 使 用 一 个 级 联 的 粒子 滤波 器 
(Cascaded Particle Filters) 结 合 多 个 在 线 ( 或 离线 ) 学 习 到 的 检测 模型 来 提高 粒子 
采样 效率 和 目标 跟踪 准确 度 。 该 方法 在 多 个 低 帧 率 测 试 实例 中 取得 较 好 的 跟踪 效 
果 。 然 而 , 它 需 要 一 个 事先 训练 好 的 可 靠 的 观测 模型 和 一 个 离线 的 学 习 过 程 ,此 
外 , 它 不 能 处 理 大 范围 快速 运动 的 目标 跟踪 ,例如 多 摄像 机 镜头 切换 等 。 最 近 ， 
Kwon 和 Leet 中 提出 了 一 种 基于 Wang-Landau 采样 1 的 能 够 处 理 多 种 运动 突变 
的 目标 跟踪 算法 。 它 的 基本 思想 是 使 用 Wang-Landau 算法 在 整个 样本 空间 中 对 
滤波 分 布 进行 全 局 采样 从 而 避免 陷入 局 部 的 最 优 模式 。 由 于 能 有 效 地 避免 在 采样 
过 程 中 陷入 局 部 最 优 状态 ,这 种 方法 在 多 种 不 连续 运动 场景 中 取得 了 很 好 的 跟踪 
结果 。 然 而 ,该 方法 所 使 用 的 提议 分 布 是 基于 均匀 分 布 的 全 局 跳跃 (Global Stoch- 
asitc Hopping) 模 式 ,没有 考虑 局 部 模式 的 细节 提炼 (Detailed Mode Refinement)， 
尽管 作者 使 用 了 一 个 退火 模式 来 分 阶段 压缩 (Shrink) 样 本 空间 ,整个 采样 过 程 仍 
然 需要 相当 数目 的 粒子 来 近似 复杂 的 滤波 分 布 , 因 而 在 实际 应 用 中 , 离 实时 跟踪 需 
要 还 有 一 定 的 距离 。Wang-Landau 算法 源 自 早先 在 统计 物理 中 有 着 广泛 应 用 的 
Multicanonical 采样 算法 65 , 它 在 物理 学 中 的 应 用 主要 包括 态 密度 (Density of 
States, DoS) 和 其 他 一 些 重要 物理 量 的 计算 。 尽 管 Wang-Landau 算法 在 统计 物理 
学 中 的 应 用 取得 了 很 大 的 成 功 ,但 是 至 今 还 没有 坚实 的 理论 证 明 Wang-Landau 算 
法 在 一 般 状态 空间 中 的 收敛 性 ,并 且 在 一 些 统计 学 和 物理 学 应 用 中 已 发 现 它 只 能 
取得 有 限 的 统计 精度 3 。 
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针对 Wang-Landau 采样 算法 在 贝 叶 斯 滤波 跟踪 中 的 采样 效率 问题 ,本 文 作 
者 中 在 序 贯 贝 叶 斯 滤波 框架 下 ,将 随机 逼近 蒙特 卡 洛 (SAMC)' 中 采样 方法 引入 到 
贝 叶 斯 滤波 框架 中 ,提出 了 一 种 序 贯 随机 逼近 蒙特 卡 洛 采样 算法 实现 对 突变 运动 
的 目标 跟踪 。 与 文献 [90] 不 同 , 作 者 显 式 地 构建 一 个 包含 态 密度 项 的 试验 分 布 替 
代 原 始 的 滤波 分 布 ,并 使 用 Metropolis-Hastingscs5 算 法 从 这 个 试验 分 布 中 采样 。 
从 本 质 上 来 看 ,这 种 采样 方式 同样 也 源 自 于 Multicanonical 采样 方法 ,因而 具备 有 
效 避 免 陷 人 局 部 模式 的 重要 特性 ; 另 一 方面 , 它 同 时 属于 动态 加 权重 要 性 采样 算 
法 5' 吧 的 范畴 ,样本 的 权重 在 采样 过 程 中 是 动态 更 新 的 ,这 有 别 于 序 贯 重 要 性 采样 
算法 的 粒子 的 权重 估计 是 一 次 性 获得 的 。 动 态 加 权 的 优点 在 于 ,通过 使 用 一 个 在 
2R n9 Bt pL VEL FE (Stochastic Approximation Process，SAP) 壕 代 地 估计 态 密 度 
项 ,使 样本 权重 估计 的 精度 可 以 在 采样 过 程 中 得 到 持续 地 提升 。 此 外 ,作者 在 蒙特 
卡 洛 采样 过 程 中 通过 引入 一 个 在 线 预测 模型 ,提出 一 个 新 的 自 适应 马 氏 链 蒙 特 卡 
洛 采样 算法 以 进一步 提高 整体 采样 效率 。 作 者 的 实验 表明 ,该 方法 能 够 有 效 地 跟 
踪 多 种 运动 突变 复杂 场景 中 的 运动 目标 。 

从 采样 方式 来 看 , Wang-Landau 算法 与 SAMC 采样 算法 都 属于 自 适应 马 氏 链 
蒙特 卡 洛 (Adaptive MCMC) R FES EO AY GE HE, Adaptive MCMC 算法 的 提 
出 是 为 了 克服 传统 MCMC 算法 普遍 存在 的 缓慢 的 收敛 速度 ,提高 采样 的 混合 性 。 
需要 注意 的 是 ,无 论 是 Metropolis-Hastings 算法 62 还 是 Gibbs 采样 算法 09 , 当 
应 用 于 多 模 分 布 采样 问题 时 ,往往 样本 的 接受 率 都 很 低 ,尤其 在 高 维 复 杂 多 模 情 况 
下 ,采样 往往 停留 在 某 个 样本 点 或 长 时 间 陷 入 局 部 模式 无 法 实现 模式 跳跃 (Modes 
Hopping)。 事 实 上 ,这 与 提议 分 布 的 选择 有 很 大 的 关联 。 一 种 理想 的 情况 是 , 尽 
可 能 选择 或 定义 一 种 具有 自 校正 机 制 的 提议 分 布 ,使 它 尽 可 能 地 靠近 实际 的 目标 
分 布 。 这 种 自 校 正 机 制 ,也 就 是 自 适应 性 ,可 以 利用 马 氏 链 上 已 产生 的 样本 信息 来 
辅助 更 新 提议 分 布 的 参数 。 这 就 是 Adaptive MCMC 采样 算法 的 基本 思想 。 值 得 
注意 的 是 ,无 限制 地 使 用 样本 信息 更 新 提议 分 布 将 会 破坏 转移 核 的 马尔 科 夫 性 ,从 
而 破坏 马 氏 链 的 平稳 分 布 。 一 个 可 行 的 方案 是 ,在 初始 采样 阶段 实行 提议 分 布 的 
自 适应 更 新 ,使 估计 的 提议 分 布 较为 接近 目标 分 布 , 而 在 后 续 的 采样 阶段 则 采用 标 
准 的 MCMC 算法 从 而 确保 马 氏 链 收敛 。Gelfand 和 Sahu[104] 通 过 模拟 多 条 并 行 
的 马 氏 链 , 使 用 采样 重要 性 重 采样 (SIR) 算 法 中 选择 具有 高 接受 率 的 转移 核 而 抑 
制 那些 低 接受 率 的 转移 核 。 这 种 方法 的 基本 出 发 点 是 使 用 近似 的 马 氏 链 边 缘 密度 
作为 转移 密度 。Browne 和 Draperm 中 讨论 了 通过 监测 接受 率 的 变化 调整 转移 核 的 
部 分 (或 单个 ) 成 分 ,使 得 采样 过 程 中 确保 一 定 的 接受 概率 ,提高 采样 的 混合 性 。 由 
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于 MCMC 算法 的 有 效 性 很 大 程度 上 依赖 于 马尔 科 夫 转移 核 的 设计 ,然而 如 何 有 效 
地 选择 提议 分 布 以 及 精确 地 调节 其 参数 仍然 是 个 极 具 挑战 性 的 课题 ,这 是 因为 在 
实际 应 用 中 往往 无 法 预知 目标 分 布 的 形状 ,尤其 是 在 高 维 的 状态 空间 中 。 近 年 来 ， 
在 统计 学 等 相关 领域 自 适 应 MCMC 算法 无 论 是 在 理论 研究 还 是 在 实际 应 用 方面 都 
获得 了 广泛 的 关注 ,已 经 成 为 MCMC 研究 领域 里 一 个 新 的 研究 热点 。 其 中 最 重要 的 
理论 进展 包括 :Gilks 等 人 中 以 及 Brockwell 和 Kadane^* 提出 使 用 再 生 (Regenera- 
tive) 马 尔 科 夫 链 , 它 在 每 个 再 生 时 刻 更 新 提议 分 布 的 参数 ;Harrio 56 AC"? 提出 一 种 
自 适应 的 Metropolis 采样 算法 , 它 利 用 马 氏 链 上 的 所 有 历史 样本 信息 更 新 提议 分 布 
的 协 方差 矩阵 。 此 外 ,Andrieu 和 Robert") , Atchadé 和 Rosenthal"? ,以 及 Roberts 
和 Rosenthaln 2 等 人 为 自 适应 MCMC 算法 的 理论 进展 和 应 用 做 出 了 重要 贡献 , 包 
括 收敛 率 和 各 态 历经 性 (Ergodicity) 的 理论 证 明 。 

总 之 ,在 计算 机 视觉 研究 领域 ,国内 外 基于 自 适应 MCMC 采样 的 研究 工作 还 
很 少 。 在 视觉 跟踪 研究 领域 ,尽管 国内 外 对 运动 突变 条 件 下 的 视觉 跟踪 的 研究 已 
经 取得 了 一 些 重要 成 果 , 但 是 在 这 复杂 运动 条 件 下 实现 有 效 的 视觉 跟 踪 仍 然 是 个 
巨大 的 挑战 ,而 这 又 是 来 源 于 计算 机 视觉 领域 的 实际 需求 而 又 不 得 不 解决 的 课题 。 
本 研究 正 是 从 这 一 问题 的 特点 和 难点 人 手 , 基 于 自 适 应 采样 的 理论 和 指导 思想 探 
索 有 效 解决 这 一 问题 的 理论 方法 和 技术 。 
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随机 模拟 是 利用 计算 机 进行 数值 计算 的 一 种 概率 统计 方法 ,也 称 为 统计 模拟 
方法 。 它 通常 通过 统计 试验 或 随机 采样 求解 数学 .物理 .工程 技术 等 不 同 领域 问题 
的 近似 数值 解 。 随 机 模拟 应 用 极为 广泛 , 既 可 以 用 来 解决 随机 问题 ,也 可 以 用 于 求 
解 确定 性 的 科学 问题 。 随 机 模拟 的 思想 ,最 早 可 以 追溯 到 1777 年 法 国 数学 家 Buf- 
fon 设计 实验 求解 圆周 率 x。 真 正 意义 上 使 用 随机 模拟 方法 解决 科学 问题 是 在 20 
世纪 40 年 代 。 当 时 它 被 用 于 模拟 裂变 物质 的 中 子 链 式 反应 ,一 项 与 原子 弹 研 究 计 
划 有 关 的 秘密 计划 。 物 理学 家 Von Neumann 等 人 把 这 种 随机 模拟 方法 称 为 蒙特 
卡 洛 (Monte Carlo) 方 法 。 

在 科学 研究 中 真正 系统 地 运用 Monte Carlo 方法 进行 随机 试验 是 在 计算 机 诞 
生 之 后 。 在 20 世纪 50 年 代 , 统 计 物 理学 家 Metropolis 等 人 0 提出 了 马 氏 链 蒙 特 
卡 洛 (MCMC) 方 法 ,使 随机 模拟 真正 地 应 用 到 各 个 不 同 的 科学 研究 领域 。1970 
年 , Hastings"?! xf. Metropolis 算法 进行 了 推广 并 提出 了 至 今 仍 得 到 广泛 应 用 的 
Metropolis-Hastings 算法 。 随 机 模拟 技术 与 计算 机 科学 的 发 展 息息相关 ,20 世纪 
80 年 代 以 后 随 着 计算 机 科学 技术 的 迅速 发 展 极 大 地 推动 了 Monte Carlo 技术 的 研 
究 和 发 展 , 它 在 组 合 优化 、 贝 叶 斯 推断 、 非 参数 统计 推断 、 生 物 统计 学 等 方面 得 到 了 
广泛 的 应 用 。1984 4E.S. German 和 D. German"? 提出 了 Gibbs 采样 算法 ,这 是 
一 种 基于 条 件 分 布 的 迭代 采样 方法 , 它 已 成 为 统计 计算 的 一 种 标准 工具 。 

随 着 随机 模拟 与 试验 设计 在 各 个 学 科 领 域 的 广泛 应 用 ,许多 领域 的 复杂 科 
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学 问题 对 蒙特 卡 洛 技术 的 要 求 也 不 断 提 高 。 传 统 的 MCMC 方法 对 高 维 复 杂 分 
布 进行 采样 时 往往 遇 到 很 大 困难 ,需要 更 为 有 效 的 采样 算法 与 采样 策略 来 提高 
随机 采样 效率 。 近 年 来 , 自 适应 马 氏 链 蒙 特 卡 洛 (Adaptive MCMC) 采 样 方 
法 1 中 的 研究 与 进展 ,有 效 地 克服 了 传统 MCMC 算法 的 缺点 与 不 足 , 为 MC- 
MC 方法 在 统计 计算 中 的 进一步 应 用 奠定 了 坚实 的 基础 。 

本 章 主 要 介绍 MCMC 和 Adaptive MCMC 的 基本 概念 ,理论 和 算法 实现 ,以 
及 它们 在 计算 机 视觉 中 的 应 用 。 


4» 2.2 Monte Carlo 采样 参 


2.2.1 Monte Carlo 积分 


在 统计 推断 领域 ,很 多 感 兴趣 的 统计 量 通常 可 以 表示 为 某 随 机 变量 x 的 函数 
ho) fS HI ELA CAO]. S f(x) 表示 变量 的 概率 密度 ,y 表示 h(x) 关 于 了 的 期 望 。 
如 果 能 够 从 了 抽样 一 组 i.i.d 样本 as ,xs，…z,, 那 么 就 可 以 使 用 这 组 样本 的 均值 
来 近似 pe: 


R= Dh y (Q.D 
i=l 


这 里 p= [aco parde, JEW TÉ o^ 可 以 通过 


vag) = MU Go A (2.2) 
来 估计 。 需 要 指出 的 是 ,Monte Carlo 求 积 法 是 否 收敛 ,取决 于 |A(z)| 的 期 望 是 否 


存在 。 

在 统计 计算 中 ,Monte Carlo 求 积 估计 有 着 广泛 的 应 用 。 例 如 , 贝 叶 斯 分 析 中 
的 后 验 矩 估计 、 后 验 概 率 计 算 ,边缘 密度 计算 以 及 其 他 一 些 依赖 于 随机 偏差 产生 的 
统计 算法 等 。Monte Carlo 积分 收敛 速度 为 ww 2“ 1 <r<2, Alii Monte Carlo We 
SIE RETE T Ol?)。 尽 管 其 他 一 些 数 值 积分 方法 能 够 取得 更 快 的 收敛 速度 ,但 是 
在 高 维 空间 中 数值 直 积 分 法 往往 受 限于 维度 问题 。Monte Carlo 方法 在 样本 空间 
中 随机 采样 目标 分 布 ,但 并 非 对 整个 空间 进行 穷尽 探索 ,因而 对 样本 空间 维度 的 敏 
感性 较 低 。 但 是 , 当 维 度 很 高 时 ,Monte Carlo 模拟 需要 大 量 的 样本 来 近似 实际 目 
标 分 布 ,因而 也 需要 很 高 的 计算 代价 。 
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2.2.2 Monte Carlo 采样 


对 于 一 个 随机 系统 ,其 中 的 一 些 物理 量 可 能 不 具有 确定 值 , 而 是 满足 某 个 特定 
的 概率 分 布 。Monte Carlo 方法 的 基本 思想 就 是 通过 一 组 服从 特定 分 布 的 样本 点 ， 
来 估计 感 兴 趣 的 物理 量 的 统计 分 布 律 。 物 理 上 的 实验 粒子 方法 ,就 是 使 用 一 个 粒 
子 集 ( 轨 道 ) 来 描述 一 个 统计 集成 (Ensemble)。 因 而 ,实现 Monte Carlo 计算 的 首 
要 工作 就 是 如 何 从 一 个 已 知 分 布 中 抽取 样本 。 

我 们 称 想 要 采样 的 概率 分 布 了 为 目标 分 布 。 如 果 目 标 分 布 来 自 一 个 标准 
参数 复 ,那么 有 很 多 可 用 于 产生 样本 点 的 统计 软件 和 工具 。 通 常 , 这 些 软件 和 
工具 都 依赖 于 标准 均匀 分 布 产生 随机 数 。 本 节 主 要 讨论 当 目 标 分 布 不 属于 标 
准 参数 簇 时 如 何 产生 实现 对 随机 变量 的 模拟 ,包括 两 种 基本 的 采样 方法 :拒绝 
采样 (Rejection Sampling) 方 YEU 和 重要 性 采样 (Importance Sampling. 
区 和 

1. 拒绝 采样 

如 果 目 标 分 布 f 在 仅仅 差 一 个 比例 常数 的 情况 下 是 已 知 的 ,那么 使 用 拒绝 采 
FEM. f 中 准确 采样 是 可 行 的 。 这 种 采样 方法 依赖 于 一 个 分 布 较为 简单 的 辅助 分 布 
函数 ,通过 它 来 修正 采样 概率 。 令 q 表示 这 个 辅助 概率 分 布 , 它 通常 选择 为 易于 采 
样 和 计算 的 。 令 e(x) 二 Mgq(z) 表 示 一 条 包 络 (Envelopcurve), 它 满足 : 

fG) € MqG),M 1 (2.3) 
基于 以 上 表示 ,拒绝 采样 算法 可 以 描述 为 : 

CL) 从 辅助 分 布 9 中 抽取 样本 > 一 4(，); 

(2) 抽取 随机 数 u~ Unif(0.1); 

(3) E fCy)/eCy) <u, 则 拒绝 y, 并 返回 步骤 (1); 

(4) 否则 接受 y 为 目标 分 布 的 一 个 样本 , 即 z==y, 然 后 返回 步骤 (1) ,直至 抽取 
到 所 需 数量 的 样本 。 

值得 注意 的 是 ,拒绝 采样 算法 抽取 的 样本 点 属于 服从 目标 分 布 f 的 i.i.d 样 
本 ,这 个 采样 过 程 并 没有 引入 近似 估计 ,因而 采样 分 布 是 精确 的 。 此 外 ,对 于 目标 
分 布 了 在 仅 差 一 个 比例 常数 & 是 已 知 的 情况 (例如 在 Bayes 分 析 中 f 通常 是 一 个 
后 验 分 布 , 它 等 比例 于 先 验 密度 和 观测 似 然 的 乘积 ) ,这 时 如 果 我 们 能 比较 容易 地 
计算 g(z) 二 f(z)/k, 那 么 在 这 种 情况 下 也 可 以 使 用 拒绝 采样 算法 ,并 且 采 样 分 布 
也 是 精确 的 。 这 是 因为 :按照 拒绝 采样 的 思想 ,如 果 我 们 能 找到 一 条 包 络 ,满足 对 
BUB. x A g GO Sel x) ,那么 当 wu<g(y)/el(y) 时 采样 被 接受 ,否则 采样 被 拒绝 。 在 
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这 种 情形 下 采样 比例 仍然 是 正确 的 ,因为 当 了 被 g 取代 时 ,未 知 常数 上 在 式 (2.3) 
中 被 抵消 了 。 

与 一 元 分 布 的 情况 相似 ,通过 构造 一 个 多 元 包 络 ,多 元 目标 分 布 也 可 以 使 用 拒 
绝 采 样 算 法 ,算法 思想 在 实现 上 是 相同 的 。 当 然 , 要 构造 一 条 合适 的 包 络 来 覆盖 多 
元 目标 分 布 并 不 容易 ,这 需要 对 目标 分 布 有 足够 的 了 解 ,确保 包 络 对 目标 分 布 的 覆 
盖 。 一 般 来 说 ,拒绝 采样 算法 中 对 包 络 的 要 求 包括 :易于 构造 和 采样 ,使 它 能 较 好 
地 获 盖 目标 分 布 ; 较 低 的 样本 拒绝 率 。 

理论 上 ,拒绝 采样 算法 可 以 精确 地 对 一 般 的 目标 分 布 进 行 采 样 ,但 是 , 它 存 在 
一 个 主要 缺陷 , 那 就 是 在 实际 应 用 中 很 难 在 整个 样本 空间 确定 合适 的 包 络 常数 M。 
一 方面 ,过 大 的 M 值 尽 管 可 以 确保 对 目标 分 布 的 覆盖 ,但 此 时 的 样本 接受 率 
1 


Pr(y is accepted) — Pru < nes) M (2.4) 
变 得 非常 低 , 这 就 使 拒绝 采样 方法 在 高 维 情形 下 很 难 取得 满意 的 成 效 。 


2. 重要 性 采样 

在 Monte Carlo 求 积 法 中 ,如 果 使 用 直接 采样 ,那么 被 积 函数 估 值 所 使 用 的 样 
本 点 是 以 均匀 的 概率 抽取 的 ,完全 不 考虑 函数 本 身 的 属性 特征 。 假 定 被 积 函数 在 
样本 点 处 临近 区 域 有 一 个 陡峭 的 峰 (Peak) ,目标 分 布 的 尾部 (Tail) 对 于 均值 估计 
的 贡献 很 小 。 直 观 上 看 ,在 对 均值 估计 起 重要 贡献 的 区 域 应 该 抽取 更 多 的 样本 。 
这 就 要 求 寻求 一 个 与 被 积 函数 的 分 布 情况 较为 相似 的 辅助 分 布 函数 , 转 而 从 中 抽 
取样 本 ,从 而 提高 估 值 精度 。 这 就 是 重要 性 采样 的 基本 思想 , 它 基 于 这 样 的 一 个 思 
路 : 即 h(x) 关 于 概率 分 布 f 的 期 望 可 以 表示 为 


= [ncn parde = Jace Lads idm 
或 
[nca 7 [ico LLL "- 
Inm LEE f 


其 中 辅助 函数 g(x) 称 为 重要 性 采样 函数 或 重要 性 函数 。 
假定 按照 重要 性 采样 方法 从 重要 性 函数 g 中 抽取 nn 个 i.i.d 样本 点 zi， 
Lrt san DBA h(x) 关于 概率 分 布 f 的 期 望 可 以 按 下 式 进行 估计 : 


= L awa) (2.7) 


i=l 
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HP wa) = f Cr /g GO ,是 样本 a; 的 权重 系数 。 当 目标 分 布 f 是 仅 差 一 个 比 


例 常数 下 已 知 时 ,应 该 考虑 使 用 标准 化 权重 w Gr) = wa / PG), Je E 


例 常数 在 归 一 化 时 被 抵消 ,正如 前 面 所 述 ,这 种 归 一 化 加 权 方 式 对 Bayes 分 析 非 常 
重要 。 

如 何 选择 重要 性 函数 g 是 个 较为 复杂 的 问题 。 事 实 上 ,一 个 基本 的 准则 是 f 
(xz)/g(x) 有 界 同 时 e 的 尾部 比 f 的 重 (Heavy)。 一 旦 这 一 准则 未 能 得 到 满足 ,将 
可 能 导致 样本 间 重 要 性 权重 的 巨大 差别 。 特 别 地 ,如 果 一 个 从 g 抽取 的 样本 在 f£ 
下 的 密度 值 远 高 于 在 g 下 的 值 ,那么 它 的 权重 将 变 得 异常 大 ,这 将 导致 很 大 的 估计 
方差 。Liu SAC JE HUE CRÉEZ Bit (Effective Sample Size，ESS) 来 度量 重要 性 函 
数 的 效率 。 当 使 用 未 归 一 化 权重 时 ,ESS 可 以 定义 为 


n 


1+ Tar{w" Cr)} 
直观 上 看 ,有 效 样本 量 ESS 是 反映 重要 性 函数 g 与 目标 分 布 f 差异 的 一 个 非 

正式 度量 , 它 也 可 以 解释 为 重要 性 采样 算法 中 所 用 的 个 加 权 样 本 相当 于 NEss 个 

真正 从 f 中 抽取 并 用 于 Monte Carlo 估计 的 无 权重 (Unweighted)i.i. d 样本 。 


(2.8) 


Ness = 


@ 2.3 MCMC 采样 @ 


在 2.2. 2 小 节 已 经 介绍 了 , 当 直 接 对 目标 分 布 进 行 采样 比较 困难 时 ,我 们 可 以 
使 用 拒绝 采样 或 重要 性 采样 方法 来 抽取 一 个 样本 集 。 这 类 方法 抽取 的 样本 主要 用 
于 估计 某 一 函数 的 期 望 。 在 这 一 节 将 介绍 使 用 马 氏 链 蒙 特 卡 洛 (MCMC) 方 法 生成 
近似 服从 目标 分 布 的 样本 。MCMC 方法 与 前 面 一 节 介 绍 的 随机 抽样 方法 的 主要 
区 别 在 于 其 迭代 模拟 的 特点 ,而 且 能 够 适应 各 种 困难 的 采样 问题 。 作 为 一 个 通用 
的 采样 框架 , MCMC 对 于 问题 维度 的 增加 不 会 降低 其 收敛 速度 。 
MCMC 方法 的 精髓 在 于 构造 一 条 适当 的 链 , 使 它 收敛 于 某 一 个 极限 平稳 分 
布 。 令 样本 序列 aU eat? yore 表示 一 条 长 度 为 nn 的 马 氏 链 , 其 状态 空间 可 以 是 
连续 的 或 离散 的 。 以 离散 状态 空间 为 例 ,如 果 r 满足: 
pha | a pa Ve te liad (2.9) 
那么 称 随机 过 程 x 为 一 条 马 氏 链 。 如 果 马 氏 链 在 状态 空间 中 的 演变 (Evolution ) 
仅仅 依赖 于 当前 链 的 状态 并 且 使 用 固定 的 转移 矩阵 , 即 T AT C? |?) ,那么 称 
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这 种 链 为 齐 次 马 氏 链 (Hmogeneous Markov Chain), Al 2-1 所 示 为 离散 状态 空间 
中 一 条 齐 次 马 氏 链 状 态 转 移 的 示意 , 它 基 于 一 个 固定 不 变 的 转移 矩阵 。 当 这 条 马 
氏 链 是 非 周 期 (Aperiodicity) 不 可 约 (Irreducibility) 时 ,x 收敛 到 该 链 的 极限 平稳 
分 布 ( 非 周期 是 指 , 对 于 链 上 的 任何 状态 ,都 能 以 大 于 零 的 概率 转移 到 另外 一 个 状 
态 ; 不 可 约 则 表示 链 不 应 该 陷入 循环 模式 )。MCMC 方法 的 基本 采样 策略 就 是 构造 
一 条 非 周 期 不 可 约 的 马 氏 链 ,使 其 平稳 分 布 对 应 于 给 定 的 目标 分 布 f。 当 这 条 链 足 
够 长 时 ,该 马 氏 链 获 得 的 样本 x 近似 于 目标 f 的 边际 分 布 。 构 造 这 样 一 条 链 , 一 个 
充分 但 非 必 要 的 条 件 是 可 逆 (Reversibility) 或 细致 平衡 (Detail Balance) 条 件 , 即 

PZ? TEE | 2°) = pee PT” |e) (2,10) 


a^ 
e 
E] 
ES 
- 
外 
人 
eo 
are 
oo. 
=o 
e 
| 


(a) (b) 


图 2-1 齐 次 马 氏 链 的 状态 转移 示意 及 其 转移 矩阵 T 
(a) 齐 次 马 氏 链 的 状态 转移 示意 ;(b) 转 移 矩阵 T 
当 状态 空间 非 离散 而 是 连续 的 时 候 , 转 移 矩 阵 工 就 成 为 了 对 应 的 转移 核 (Kernel) 
K .转移 概率 p(x) 对 应 于 特征 函数 : 


plr?) = [oci Ke | a) dae (2.11) 


式 中 , 核 K 是 条 件 密度 。 

MCMC 采样 理论 及 其 应 用 是 统计 计算 领域 的 一 个 研究 热点 ,至 今 已 有 大 量 适 
用 于 不 同 领 域 和 特定 科学 问题 的 采样 算法 。 这 一 节 重 点 介绍 一 些 基 本 的 MCMC 
算法 ,包括 :Metropolis-Hastings # EO") , Gibbs 算法 59 ,以 及 它们 的 变 体 。 这 
些 MCMC 算法 是 研究 和 实现 更 为 高 级 的 MCMC 算法 (例如 , 自 适应 MCMC 方 
法 ) 的 基础 ,在 众多 学 科 领 域 有 着 广泛 的 应 用 。 本 节 介 绍 的 MCMC 算法 都 是 基于 
齐 次 马 氏 链 构 建 ,在 2.4 节 介 绍 自 适应 MCMC 时 将 讨论 非 齐 次 (Non-Hmoge- 
neous) 的 情况 。 
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第 2 章 MCMC 和 自 适 应 MCMC 


2.3.1 Metropolis-Hastings 采样 


1. 基本 的 Metropolis-Hastings 链 

Metropolis-Hastings 算法 是 一 种 流行 的 构造 马 氏 链 的 通用 方法 。 对 于 给 定 的 
目标 分 布 f ,该 算法 起 始 于 某 个 初始 样本 点 e ,和 迭代 地 从 一 个 提议 分 布 (Proposal 
Distribution) 抽 取 一 系列 样本 点 构建 一 条 马 氏 链 。 假 定 在 当前 时 刻 i, 马 氏 链 处 于 
状态 x , Metropolis-Hastings 算法 的 一 次 迭代 产生 一 个 新 的 样本 207 ,算法 描 
述 如 下 : 

(1) 从 提议 分 布 ga(， ;zx”) 中 抽取 一 个 候选 样本 y: 

(2) 计算 接受 比 (Acceptance Rate)a ( yi? ) ,其 中 


fo qla sy) 
fec? )gCy ia? ) | 


(3) 抽取 随机 数 w~Unif (0.1). FF ua. WES y 为 新 样本 , 即 oe FP = y 5 
则 拒绝 新 样本 , 即 ze 一 ze 。 

直观 地 看 ,Metropolis-Hastings 算法 构造 的 马 氏 链 完 全 符合 马尔 科 夫 性 。 而 
提议 分 布 的 设计 与 选择 决定 了 该 链 是 否 是 非 周期 不 可 约 的 ,如 果 这 个 条 件 得 到 验 
证 ,那么 该 算法 产生 的 样本 将 收敛 于 极限 平稳 分 布 fo 

如 果 提 议 分 布 是 对 称 的 , 即 g(y;x) 二 g(x;y), 那 么 Metropolis-Hastings 算法 
退化 为 标准 的 Metropolis 算法 9 中, 此 时 有 : 


aCysx ? ) min| 1 (2. 12) 


DY — qus f(y) 
aly; ) = min{ 1,705} (2.13) 


在 通常 情况 下 ,对 于 特定 的 问题 ,一 个 具有 特定 领域 先 验 知识 的 提议 分 布 有 助 
于 提高 Metropolis-Hastings 算法 的 采样 性 能 。 一 个 富 含 信息 的 (Informative) 提 
议 分 布 能 够 通过 适量 的 样本 覆盖 平均 目标 分 布 支撑 。 此 外 ,这 样 的 提议 分 布 的 有 
效 性 在 于 它 不 会 导致 候选 样本 被 过 度 频繁 地 接受 或 拒绝 。 多 数 MCMC 采样 算法 
的 经 验 结果 表明 :如果 一 个 提议 分 布 产 生 的 候选 样本 过 于 分 散 (比如 在 全 局 样本 空 
间 内 随机 跳跃 ) ,那么 由 此 产生 的 候选 样本 就 会 被 频繁 的 拒绝 ,从 而 导致 马 氏 链 需 
要 很 长 时 间 的 迭代 才能 充分 地 获得 目标 分 布 的 支撑 空间 的 粗略 模式 (Rough 
Mode) ;与 此 相反 ,如 果 提 议 分 布 过 于 集中 (比如 使 用 较 小 方差 的 高 斯 分 布 ) ,那么 
尽管 接受 率 较 高 ,但 马 氏 链 在 多 次 迭代 后 无 法 跳跃 到 样本 空间 中 别 的 局 部 模式 ,从 
而 不 能 有 效 地 对 其 他 区 域 进行 充分 地 采样 。 尤 其 在 高 维 情形 下 ,采样 效率 对 提议 
分 布 的 依赖 程度 将 变 得 更 为 明显 。 
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对 于 不 同 的 提议 分 布设 计 方案 ,Metropolis-Hastings 算法 的 实现 对 应 着 不 同 
的 采样 器 ,本 节 后 面部 分 将 介绍 两 种 常用 的 Metropolis-Hastings 算法 变 体 , 包 括 : 
独立 Metropolis-Hastings 算法 ,随机 游 走 Metropolis(Random Walk Metropolis， 
RWM) 算 法 以 及 多 步 试 验 Metropolis-Hastings BE , 

2. 独立 Metropolis-Hastings 算法 

在 Metropolis-Hastings 算法 中 ,如 果 提 议 分 布 使 用 一 个 固定 的 函数 使 得 它 产 
生 的 候选 样本 y 不 依赖 于 链 上 的 当前 样本 xz, 即 g(y;zx) 二 gq(y) ,那么 由 此 构建 的 马 
氏 链 称 为 独立 链 。 这 种 情形 下 ,样本 接受 比 为 


fGoqG*? ) 
Drev) (2.14) 


很 明显 ,如 果 fr) AL g(x) 270 HS ZA 3x A Ti v. BE t AE M Jd 8 As T 2] f EE UC 
敛 于 极限 平稳 分 布 fo IMS Metropolis-Hastings 算法 是 一 种 易于 实现 的 简单 采样 
方法 ,因而 它 在 统计 学 中 有 着 广泛 的 应 用 ,尤其 是 在 Bayes 分 析 中 ,常常 通过 构建 
一 条 独立 链 来 估计 后 验 矩 和 其 他 一 些 统计 量 , 此 时 Bayes 先 验 分 布 通常 被 选择 为 
提议 分 布 。 此 外 ,通过 简单 的 变换 ,可 以 建立 起 独立 Metropolis-Hastings 算法 与 
重要 性 采样 算法 在 概念 上 的 关联 。 事 实 上 , 式 (2. 14) 可 以 改写 为 


aCysa 9 ) = nin [1-4 5/2] min [15 | (2.15) 


也 就 是 说 ,此 时 的 样本 接受 比 相当 于 样本 的 重要 性 权重 比 。 这 表明 ,在 独立 链 的 构 
建 中 ,应 该 选择 那些 能 够 覆盖 目标 分 布 大 部 分 支撑 区 域 的 提议 分 布 ,否则 独立 链 的 
接受 率 将 变 成 很 低 , 并 长 时 间 停 留 在 某 个 样本 点 。 

3. 随机 游 走 Metropolis 算法 

随机 游 走 算法 是 最 为 常用 的 MCMC 算法 之 一 ,是 Metropolis-Hastings 算法 
的 一 个 特例 ,由 此 算法 构建 的 马 氏 链 也 称 为 随机 游 走 链 。 与 独立 链 不 同 , 随 机 游 走 
链 的 样本 生成 依赖 于 当前 的 样本 状态 。 假 定 在 当前 时 刻 i, 马 氏 链 的 当前 状态 为 
a? ,候选 样本 的 生成 按照 以 下 方式 : 


aly;z®) = min{ 


y = x? +e, ~ gle) (2.16) 
其 中 ,g(e) 为 一 随机 密度 。 对 于 随机 游 走 链 ,提议 分 布 具 有 以 下 特征 : 
qCysa 9 ) = hy — x?) (2,17) 


通常 ,函数 hh 可 以 选择 为 高 斯 扰动 , 即 h:N(0,0?), 其 中 6 为 高 斯 扰动 方差 。 易 于 
验证 由 此 算法 构建 的 随机 游 走 链 是 非 周 期 不 可 约 的 。 

4. 多 步 试验 Metropolis-Hastings 算法 

Metropolis-Hastings 算法 的 主要 困难 在 于 选择 合适 的 提议 分 布 , 一 个 不 恰当 
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的 提议 分 布 可 能 导致 马 氏 链 的 收敛 速度 很 慢 , 长 时 间 易于 陷入 局 部 模式 而 无 法 从 
中 跳出 。 一 个 朴素 而 直接 的 方案 就 是 扩大 提议 分 布 的 采样 范围 (Range) ,使 提议 的 
候选 样本 尽 可 能 命中 (Hit) 目 标 分 布 的 支撑 区 域 。 但 是 ,这 种 方式 由 于 盲目 的 在 庞 
大 样本 空间 中 进行 探索 往往 造成 极 低 的 样本 接受 率 ,尤其 是 在 高 维 的 状态 空间 中 。 
针对 这 种 矛盾 ,Liu 等 人 提出 一 种 通过 扩大 提议 分 布 的 采样 范围 ,但 同时 不 影响 采 
样 混合 性 的 多 试验 Metropolis-Hastings 算法 中。 

假定 在 当前 时 刻 i, 马 氏 链 的 状态 为 zx” ,多 步 试验 Metropolis-Hastings 算法 
的 一 次 迭代 产生 一 个 新 样本 zx“1? ,算法 描述 如 下 : 

A) WEIL AR gC + sc) HH m A i. i. d 候选 样本 :yy 0m 

(2) 从 m 个 候选 样本 中 ,以 概率 we ,y;) 

wa.b) = f(b)qla;b)àla,b) (2.18) 

抽取 候选 样本 y; FE A Ca 0 Jy — 3E f KI IAL PR C s 

(3) 给 定 候选 样本 y; ,使 用 提议 分 布 g(，;y;) 抽 取 m—1^ 个 iid 样本 :yi， 
yer sYn—1 FARES ym yj: 


(4) 计算 采样 接受 比 a Cy; sx): 


(2. 19) 


alyj;x®) = min 


>> wr” wy) | 
=1 


1, 
SM wy; +9) 
i=l 


G) 以 概率 a Cy; i ) 接 受 y; 为 新 样本 , 即 令 OP = ys PMG w ,并 令 


(CD 
o 


xit =r 


多 步 试验 Metropolis-Hastings 算法 通过 提议 分 布 生成 一 定量 的 候选 样本 ,并 
基于 这 些 候 选 样本 产生 一 个 新 样本 。 其 基本 思想 是 通过 一 定量 的 候选 样本 探究 目 
标 分 布 在 当前 样本 zx 附近 的 分 布 情况 .从 而 构建 一 条 马 氏 链 , 使 链 上 的 样本 具 
有 较 小 的 相关 性 (Correlation) ,以 此 来 提高 采样 的 混合 性 。 相 比 于 前 面 所 述 的 其 
他 几 种 MCMC 算法 ,该 采样 算法 在 理论 上 似乎 更 完美 一 些 。 但 需要 注意 的 是 ,多 
个 候选 样本 的 权 值 计算 意味 着 更 大 的 计算 代价 ,尤其 是 基于 Bayes 分 析 的 视觉 计 
算 应 用 中 (例如 ,图 像 分 割 和 视觉 跟踪 等 ), 权 值 的 计算 往往 涉及 代价 很 高 的 似 然 
计算 。 


2.3.2 Gibbs 采样 
前 面 所 述 的 Metropolis-Hastings 算法 并 未 对 样本 空间 的 维度 进行 专门 的 讨 
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论 。 对 于 多 维 目标 分 布 ,Gibbs 采样 co 是 最 为 常用 的 一 种 MCMC 算法 , 它 通 过 目 
标 分 布 的 边缘 分 布 序 贯 抽取 样本 来 构造 一 条 收敛 于 目标 分 布 的 马 氏 链 。 

对 于 p AE BML AE SE x = (Cay te etn cdd g(a Din exeat). 
假定 目标 分 布 六 的 条 件 密度 f Coil ,i 二 1,2,…,p 有 显 式 的 表达 式 且 易 于 采样 ， 
那么 简单 的 (Plain)Gibbs 采样 过 程 可 描述 如 下 : 

A) 初始 化 x09 = Caf? 528? ue rit, 

(2) For i—0 to N—1 

- dB xh? f dz 52% 5-22); 


- FAR rit P fae | cht? af? ue x; 
= 抽取 xh? ~ F(a; | xf yo ch afe ce); 


= FAR (mo f, af oit 08, oP) 
End For. 

在 Gibbs 采样 中 ,一 个 很 重要 的 特点 是 序 贯 地 采用 最 新 值 。S，German 和 D. 
German?” jE] T. aj? 的 极限 边缘 分 布 等 于 目标 分 布 f 的 第 j 维 边缘 分 布 , 并 且 由 
Gibbs 采样 生成 的 样本 可 以 用 于 估计 随机 变量 x 的 函数 的 期 望 。 事 实 上 ,Gibbs o 
样 算 法 是 Metropolis-Hastings 算法 的 一 个 特例 。 在 Metropolis 一 Hastings 算法 
中 ,对 于 x 的 每 一 维 j= 二 1,2,…,p, 采 用 以 下 的 提议 分 布 : 

: fGj|z9) x5 = 29 
e;2°)= (2.20) 
0 其 他 
如 果 易 于 验证 此 时 的 样本 接受 比 等 于 1, 那么 提议 产生 的 候选 样本 总 是 被 接受 。 

对 于 目标 分 布 f, 当 不 是 所 有 的 条 件 密度 都 有 显示 的 表达 式 或 不 易于 抽样 时 ， 
混合 Gibbs 采样 和 Metropolis-Hastings 采样 的 方法 能 够 有 效 地 构建 Gibbs 链 。 这 
类 方法 包括 Metropolis-within-GibbsP? 和 格 点 Gibbs 采样 69 等 。 


2.3.3 MCMC 算法 分 析 


在 前 面 的 章节 里 我 们 介绍 了 马 氏 链 的 基本 构建 方法 和 相关 算法 ,本 节 主 要 讨 
i£ MCMC 算法 的 收敛 ,混合 性 及 其 诊断 等 问题 。 

给 定 目 标 分 布 ,MCMC 算法 的 可 靠 性 很 大 程度 上 依赖 于 马 氏 链 的 样本 序列 是 
和 否 收银 于 极限 平稳 分 布 以 及 收敛 速度 。 前 面 介 绍 的 Metropolis-Hastings 算法 与 
Gibbs 算法 都 能 够 收敛 于 其 极限 平稳 分 布 。 但 是 ,在 实际 应 用 中 还 必须 对 所 构建 
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的 马 氏 链 有 充分 的 了 解 , 以 便 知道 该 链 何 时 能 够 输出 足够 代表 目标 分 布 的 样本 ,从 
而 对 感 兴趣 的 统计 量 进行 可 靠 的 估计 。 在 对 复杂 目标 分 布 进行 采样 时 ,MCMC 算 
法 往往 收敛 缓慢 ,需要 长 时 间 的 模拟 和 和 迭代 才能 接近 目标 分 布 , 特 别 是 当 样 本 空间 
维度 很 高 的 情形 下 。 因 而 ,如 何 实施 MCMC 算法 以 确保 马 氏 链 的 收敛 以 及 良好 的 
混合 性 就 显得 尤为 重要 。 在 MCMC 采样 算法 的 实际 运行 中 ,我 们 首先 需要 考虑 的 
是 马 氏 链 是 否 已 近似 地 收敛 到 其 平稳 目标 分 布 。 当 前 ,已 有 一 些 现成 的 分 析 方 法 
可 用 于 诊断 马 氏 链 的 收敛 性 2 。 但 值得 注意 的 是 ,对 不 同 马 氏 链 的 收敛 性 诊 
断 , 很 难 找到 一 种 通用 的 分 析 方 法 和 工具 。 此 外 , MCMC 算法 还 需 考虑 链 的 混合 
性 , 它 通常 可 以 通过 两 个 方面 来 反映 , 即 马 氏 链 上 的 样本 对 目标 分 布 支撑 区 域 的 
“覆盖 ?程度 ,以 及 马 氏 链 上 近似 独立 的 样本 点 间 的 间隔 距离 。 

首先 ,我 们 讨论 提议 分 布 的 设计 与 选择 对 马 氏 链 收 僵 和 混合 性 的 影响 。 在 前 
面 的 介绍 中 我 们 已 经 提 到 了 提议 分 布 的 延展 度 对 MCMC 算法 的 混合 性 有 重要 的 
影响 ,同时 也 应 该 认识 到 提议 分 布 的 设计 与 选择 也 在 一 定 程度 上 依赖 于 特定 的 
MCMC 算法 。 对 于 基本 的 Gibbs 采样 算法 ,如 果 样 本 状态 的 各 维 分 量 之 间 独 立 性 
越 高 其 影响 就 越 大 。 降 低 Gibbs 链 相 关 性 提高 混合 性 的 途径 包括 :重新 参数 化 
(Reparameterization)55 和 使 用 辅助 变量 等 方法 。 对 于 Metropolis-Hastings 链 ， 
通常 的 思路 是 尽 可 能 选择 那些 与 目标 分 布 较 接 近 的 提议 分 布 ,从 而 可 以 获得 较 高 
的 样本 接受 率 。 即 便 如 此 ,提议 分 布 的 尾部 分 布 情况 也 同样 对 链 的 混合 性 有 着 重 
要 影响 。 总 的 来 说 ,提议 分 布 的 选择 与 设计 最 好 是 使 其 在 分 布 上 比 目 标 分 布 更 为 
分 散 一 些 , 同 时 使 得 目标 分 布 与 提议 分 布 之 比 在 样本 空间 内 有 界 0 。 在 接受 率 对 
链 的 混合 性 的 影响 方面 ,Roberts 等 人 指出 当 目 标 分 布 为 二 维 (不 含 ) 以 上 的 高 斯 
时 ,随机 游 走 Metropolis 算法 的 最 佳 接受 率 为 0.234, 而 当 目 标 分 布 维度 不 大 于 2 
时 最 佳 的 接受 率 大 约 为 45%D9 。 而 对 于 多 步 试 验 Metropolis-Hastings 算法 ,Liu 
等 人 中 指出 链 的 接受 率 在 40% 一 50%% 之 间 时 有 助 于 算法 取得 良好 的 混合 性 。 值 
得 注意 的 是 ,对 于 接受 率 的 设 定 在 一 定 程度 上 也 依赖 于 特定 的 目标 分 布 , 当 目标 分 
布 为 复杂 多 模 时 , 若 能 获知 其 有 关 先 验 知识 无 疑 对 提议 分 布 的 选择 以 及 接受 率 的 
设 定 都 有 重要 的 指导 意义 。 

其 次 ,我 们 讨论 马 氏 链 的 个 数 对 MCMC 算法 收敛 速度 的 影响 。 在 对 复杂 多 模 
分 布 进行 随机 模拟 时 ,往往 很 难 判定 链 是 否 已 经 近似 地 收敛 于 平稳 分 布 ,这 是 由 于 
MCMC 采样 可 能 陷入 局 部 模式 。 在 这 种 情形 下 ,考虑 构建 多 条 马 氏 链 是 个 较为 理 
想 的 选择 ,通过 综合 分 析 多 条 和 链 的 收敛 情况 可 能 有 助 于 估计 模拟 产生 的 样本 与 目 
标 分 布 的 接近 程度 529 。 事 实 上 ,学 术 界 在 使 用 单一 长 链 还 是 多 条 得 链 存在 着 一 些 


29 


) 视觉 跟踪 中 的 马 氏 链 蒙特 卡 洛 方法 


争议 。 使 用 多 条 短 链 的 观点 认为 ,通过 多 条 链 共同 对 目标 分 布 进行 探索 有 助 于 提 
高 对 多 模 分 布 模拟 的 成 功率 ,进而 降低 链 的 初始 状态 对 收敛 的 影响 。 而 使 用 单一 
长 链 的 观点 则 认为 ,使 用 多 条 短 链 在 诊断 链 收敛 不 佳 时 确实 比较 有 用 ,但 这 些 短 链 
往往 也 是 不 稳定 的 。 此 外 ,在 给 定 迭 代 次 数 ( 计 算 资源 ) 的 情况 下 ,将 计算 资源 集中 
用 于 一 条 长 链 可 能 会 获得 较 好 的 收敛 ,而 把 迭代 分 给 多 条 短 链 则 可 能 难以 获得 满 
意 的 成 效 。 即 便 存在 争议 ,一 个 不 容 忽视 的 事实 是 ,由 多 条 不 同 初始 状态 构建 的 马 
氏 链 通常 能 够 为 我 们 提供 一 些 有 关 未 知 目标 分 布 的 有 用 信息 ,这 些 信 息 有 助 于 后 
续 构 建 长 链 , 以 便 更 有 效 地 探索 目标 分 布 。 

最 后 ,我们 讨论 马 氏 链 的 丢弃 长 度 (Burn-in Perieod) 以 及 运行 长 度 。 鉴 于 任 
何 MCMC 算法 ,只 有 当 链 的 运行 长 度 为 无 穷 大 时 , 才 真 正 收敛 于 平稳 分 布 ,因而 一 
定 长 度 的 链 都 只 是 近似 地 服从 边缘 分 布 。 此 外 ,由 于 有 限 的 模拟 次 数 , 马 氏 链 对 初 
始 状 态 通 常 也 比较 敏感 。 考 虑 这 些 因 素 ,在 实际 应 用 中 MCMC 算法 通常 考虑 丢弃 
链 上 最 初 的 一 定 长 度 的 样本 。 这 些 丢 弃 样 本 的 数目 称 为 丢弃 长 度 。Gelman- 
Rubin 方法 ”1 中 是 最 为 常用 的 用 于 估计 丢弃 长 度 与 链 运 行 长 度 的 一 种 方法 , 它 通 
过 运行 多 条 链 并 利用 链 内 方差 与 链 间 方差 的 差异 来 确定 丢弃 长 度 和 链 长 。 假 定 
MCMC 算法 使 用 m 个 长 度 都 为 n 的 链 对 目标 分 布 进行 模拟 , 记 丢 弃 长 度 为 nv ,第 
j 条 链 上 的 第 i 个 样本 为 x)”, 同 时 令 


n-l m 
rcd Wc mcd y 
了 E m 275 (2. 21) 
链 间 方差 为 
Ex n S oci 
S -uci2:0 z) (2.22) 
链 内 平均 方差 为 
Se (2. 23) 


S,2 —— sp 2 (2. 24) 


- [AL 
JR CE E (2. 25) 
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从 式 (2. 25) 可 以 看 到 ,如 果 链 间 方差 较 大 , 则 R> 1 随 着 模拟 的 进行 ,limR 一 


Gelman 等 人 co 建议 使 用 阔 值 V 尺 一 1. 1 作为 马 氏 链 近似 收 和 敛 的 判定 准则 。 若 不 满足 
该 条 件 , 可 通过 增加 链 长 (或 丢弃 长 度 ) 继 续 模拟 。 此 外 ,评估 链 的 收敛 与 混合 性 还 可 
通过 一 些 定性 分 析 工 具 和 方法 ,包括 样本 路 径 图 和 自 相 关 性 图 (Autocorrelation) 等 。 


€ 2.4 HIEM MCMC 采样 S 


通过 2. 3 节 的 介绍 我 们 知道 ,传统 的 MCMC 算法 在 采样 过 程 中 通常 使 用 固定 
不 变 的 提议 分 布 。 无 论 是 Metropolis-Hastings 算法 还 是 Gibbs 采样 算法 ,以 及 它 
们 的 变 体 ,在 对 复杂 多 模 的 目标 分 布 进行 采样 时 往往 样本 的 接受 率 都 较 低 ,尤其 在 
高 维 的 情形 下 ,采样 可 能 长 时 间 停 留 在 某 个 点 无 法 跳跃 到 别 的 模式 。 事 实 上 ,这 与 
提议 分 布 的 设计 与 选择 有 很 大 的 关系 。 

自 适应 MCMC 采样 的 目的 正 是 为 了 克服 传统 MCMC 算法 普遍 存在 的 缓慢 的 
收敛 速度 ,提高 采样 的 混合 性 。 直 观 上 看 ,应 该 尽 可 能 选择 或 设计 一 种 具有 自 校正 
机 制 的 提议 分 布 ,使 它 尽 可 能 地 接近 目标 分 布 的 形状 。 这 种 自 校 正 机 制 ,也 就 是 自 
适应 性 (Adaptibility) ,通常 可 通过 马 氏 链 上 的 历史 样本 信息 来 实现 。 利 用 马 氏 链 
上 的 已 有 样本 信息 来 更 新 和 估计 提议 分 布 是 自 适应 MCMC 算法 的 基本 手段 。 值 
得 注意 的 是 ,无 限制 地 使 用 样本 信息 更 新 提议 分 布 将 会 破坏 转移 核 的 马尔 科 夫 性 ， 
从 而 破坏 马 氏 链 的 平稳 分 布 。 由 于 MCMC 算法 的 有 效 性 很 大 程度 上 依赖 于 马尔 
科 夫 转移 核 的 设计 ,然而 如 何 有 效 地 选择 提议 分 布 以 及 精确 地 调节 其 参数 仍然 是 
个 极 具 挑 战 性 的 课题 ,这 是 因为 在 实际 应 用 中 往往 无 法 预测 目标 分 布 的 形状 ,尤其 
是 在 高 维 的 状态 空间 中 。 近 年 来 ,在 统计 学 等 相关 领域 自 适应 MCMC 算法 无 论 是 
在 理论 研究 还 是 在 实际 应 用 方面 都 获得 了 广泛 的 关注 ,已 经 成 为 MCMC 研究 领域 
里 一 个 新 的 研究 热点 。 按 照 自 适应 采样 的 方式 , 自 适应 MCMC 可 以 归结 为 三 大 
类 :基于 再 生 的 自 适 应 29 ,提议 分 布 自 适应 Do%~s273 ,以 及 目标 分 布 自 适 
应 61494229 。 基 于 再 生 的 自 适应 MCMC 方法 ,主要 由 Gilks 45 AC? , Brockwell 
和 Kadan" 提出 并 发 展 的 。 再 生 马 氏 链 使 在 再 生 点 之 后 生成 的 样本 独立 于 再 生 
点 之 前 的 历史 样本 ,这 种 提议 分 布 的 更 新 能 够 保证 马 氏 链 的 收敛 ,但 是 该 类 算法 在 
实际 应 用 中 采样 效率 并 不 理想 ,而且 如 何 确定 再 生 点 也 是 一 项 困难 的 任务 。 本 节 
主要 介绍 更 为 常用 、 相 对 易于 实施 的 提议 分 布 和 目标 分 布 自 适应 算法 。 
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2.4.1 提议 分 布 自 适应 


这 类 MCMC 算法 试图 在 采样 过 程 中 在 线 学 习 一 个 高 效 的 提议 分 布 ,也 就 是 说 
在 每 次 迭代 时 都 利用 已 有 的 样本 更 新 提议 分 布 。Haario 等 人 5 提出 一 种 自 适应 
的 Metropolis 采样 算法 , 它 利 用 马 氏 链 上 的 所 有 历史 样本 信息 更 新 提议 分 布 的 协 
方差 矩阵 。 作 者 证 明了 在 一 定 条 件 下 , 随 着 采样 过 程 的 进行 ,在 线 学 习 到 的 提议 分 
布 将 收敛 于 一 个 “最 优 ”提议 分 布 。 随 后 ,Andrieu 和 Robert? 阐明 了 该 自 适应 算 
法 实际 上 属于 Ronbbins-Monro 类 型 55 fg — fp pfi Li UE (Stochastic Approxima- 
tion) 算 法 。Atchade 和 Rosenthal”! fg pfi HL i VE B 6 AY HEAR F EW T E Og — Rt 
的 自 适应 MCMC 算法 的 收敛 性 。 随 后 ,Roberts 和 Rosenthal? 以 及 Yang"! 
进一步 发 展 了 自 适应 MCMC 算法 理论 ,并 给 出 了 更 为 简单 的 条 件 确保 自 适应 
MCMC 算法 的 各 态 历 经 性 。 

id fC 0g o— a FP d 维 样本 空间 x ER” 上 的 一 个 不 变 的 目标 分 布 ， 
{Ko}oee 为 样本 空间 上 以 了 为 平稳 分 布 的 马 氏 链 转 移 核 的 一 个 集合 , 即 (fKo) 
Com fC) HO 为 一 参数 空间 。 假 定 Ky 是 非 周期 不 可 约 的 ,那么 

lim|Kit* 5 — f(o]- 0, Vx E X (2. 26) 
Hp, (uC) — ve) |= supaez |uCA) — vA) | 代表 全 变 分 距离 。 这 意味 着 ,如 果 
转移 核 不 变 , 即 9 保持 固定 不 变 , 由 此 转移 核 生 成 的 样本 将 收敛 于 目标 分 布 /。 对 
于 Adaptive MCMC 算法 ,允许 转移 核 在 采样 过 程 中 动态 的 改变 ,在 提高 采样 的 混 
合 性 的 同时 仍 能 保证 收敛 于 目标 分 布 。 记 0— 1" Jg O 型 的 一 个 随机 变量 , 它 确定 
了 在 采样 过 程 中 第 n 次 迭代 所 使 用 的 转移 核 K, BUE TES n 次 迭代 时 链 上 的 样本 
状态 为 zx” ,那么 
K,(A;x) = pla 一 A|zo = z, r” —0,AC FS) ACF 
(2. 27) 
其 中 ,So 一 c(zoD a0 yore u 0, [P r? Les DO ) Eh AA (7 ,Fe ) < 生成 的 
— AP iti Filtration) 。 给 定 初 始 状态 xz 和 初始 核 PO TLS n GRE CET PEAR AS DU 
x” 的 条 件 密度 为 
ACB aP TLIN = pla € Bl xh,» RB EF (2. 28) 
并 记 x" GA ati f 的 全 变 分 距离 为 
| A9 C; Gc , r?) — fC) | = supser |A” (BiCzo .P™ 5) — fB) || 
(2. 29) 
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对 于 这 一 类 型 的 自 适应 MCMC ££. Roberts 和 Rosenthal] 2 Hy T jf f HE fi 4 
态 历 经 性 的 充分 条 件 , 即 有 界 收 敛 条 件 (Bounded Convergence Condition) #1 iff wk 
自 适应 条 件 (Diminishing Adaptation Condition) 。 这 里 ,有 界 收 敛 条 件 指 的 是 :给 
定 初始 样本 状态 z 和 初始 核 DO ,对 任意 的 e > 0, BDL EL FE (0. Ca ,2 )} 依 概率 
有 界 , 其 中 


t.(2,0) = infin > 1:| Kf? C; — fCO | xe) (2. 30) 
表示 起 始 于 (zx,0) 的 马 氏 链 的 收敛 时 间 。 

浙 减 自 适应 条 件 指 的 是 :limD, 一 0, 其 中 

D, = sup|| Krew Cri) — Kro Csa) | (2, 3D 
渐 减 自 适 应 条 件 要 求 随 着 采样 的 进行 ,对 转移 核 参 数 的 校正 必须 逐渐 减 小 ,或 者 以 
逐渐 减 小 的 概率 进行 自 适应 采样 538 。Roberts 和 Rosenthal??? 给 出 了 关于 基于 
提议 分 布 自 适应 的 MCMC 链 收敛 的 基本 定理 。 

定理 2.1 对 于 一 个 基于 自 适应 提议 分 布 的 MCMC 算法 , 若 满 足 有 界 收敛 条 
件 和 渐 减 自 适 应 条 件 , 则 由 此 构建 的 马 氏 链 将 收敛 于 平稳 分 布 f. 

本 节 主 要 介绍 两 个 重要 且 常 用 的 基于 提议 分 布 自 适应 的 MCMC 采样 算法 : 
Adaptive Metropolis(AM) 算 法 "9 和 Adaptive Independent Metropolis-Hastings 
(AIMH) 算 法 7]。 

1. AM 算法 

在 前 一 节 中 介绍 的 随机 游 走 Metropolis 采样 算法 中 ,如 果 提 议 分布 g(y;x) 设 
定 为 均值 为 +、 协 方差 为 沁 的 多 元 高 斯 分 布 N(y;x, 沁 ), 现 在 考查 如 何 对 该 随机 
游 走 链 进行 自 适 应 构建 。 对 于 提议 分 布 的 协 方差 矩阵 ,过 大 或 过 小 都 将 可 能 导致 
链 的 高 相关 性 ,因而 如 何 设 计 和 选择 协 方差 矩阵 显得 尤为 重要 。Gelman 4 A? 
指出 随机 游 走 链 的 “最 优 ? 协 方差 矩阵 为 

E oe = (2.38 /4)) X (2. 32) 
式 中 ,d。 为 样本 x 的 维度 ;> /为 目标 分 布 的 协 方差 矩阵 。 该 协 方差 通常 情况 下 是 
未 知 的 ,Andrieu 和 Moulines??? 4&8 H ,为 计算 也 ,可 通过 最 小 化 Kullback-Leibler 
距离 


(2. 33) 


f(x) f(x) 
(x)log : =E fi 
n iuis ey | og yor) 


Haario % AO 则 提出 在 采样 过 程 中 在 线 估计 这 个 协 方差 矩阵 ,并 由 此 协 方差 矩 
阵 迭 代 采 样 的 AM 算法 。 给 定 链 的 初始 样本 状态 © 和 初始 提议 分 布 参数 uU. 
DO ,AM 算法 描述 如 下 : 
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CD 初始 化 样本 状态 z'? 和 转移 核 参 数 IP = (um NO), 
(2) For i—1 to N—1 
一 使 用 Metropolis-Hastings 转移 核 Ka C * ia? ) 抽 取 一 个 新 样本 
cP? ,其 中 609 二 (jy IO); 
- 更 新 转移 核 参数 
QU = Qu +A (UU — Vu), (2. 34) 
SHV 2 3 9 Ja (Gro Lp (umm Lu yr DM, (2.35) 
RP A, 为 学 习 率 (Learning Rate), 
End For. 
尽管 AM 算法 试图 在 线 地 估计 和 学 习 目 标 分布 的 协 方差 ,在 高 维 情形 下 算法 
所 估计 的 协 方差 在 某 些 方向 上 不 是 过 大 就 是 过 小 。 这 使 得 AM 采样 算法 的 接受 率 
不 是 过 高 就 是 过 低 , 从 而 影响 对 目标 分 布 协 方差 的 准确 估计 。 究 其 原因 ,主要 是 因 
为 采样 算法 只 是 对 样本 空间 的 有 限 范围 进行 了 探索 。 事 实 上 ,对 于 高 维 情形 下 的 
AM 采样 算法 , 当 目 标 分 布 的 成 分 之 间 近 似 不 相关 (Uncorrelated) 时 , Roberts 和 
Rosenthalo20 指 出 最 优 的 样本 接受 率 应 该 为 0.234, 过 高 或 过 低 的 接受 率 都 不 利于 
提高 采样 的 混合 性 。 
2. Adaptive Independent Metropolis-Hastings 算法 
AIMH 算法 与 前 面 介 绍 的 独立 Metropolis-Hastings 算法 较 相 似 , 区 别 在 于 前 
者 考虑 使 用 自 适 应 的 提议 分 布 ,而 后 者 使 用 固定 不 变 的 转移 核 。 同 时 ,AIHM 算法 
也 不 同 于 前 述 的 AM 算法 , 它 不 需要 通过 渐 减 自 适 应 方式 来 确保 马 氏 链 的 各 态 历 
经 性 。Holden 等 人 中 提出 使 用 马 氏 链 上 的 部 分 样本 来 更 新 提议 分 布 ,同时 避免 
渐 减 自 适应 条 件 的 要 求 。 
Wq” Ci Xm) H AIMH 算法 在 第 次 迭代 时 使 用 的 提议 分 布 ,其 中 X, K 
示 提 议 分 布 所 使 用 的 马 氏 链 上 的 历史 样本 集 。 鉴 于 AIMH 采样 算法 试图 构建 一 
条 独立 马 氏 链 , 因 而 样本 集合 X :不 应 包含 链 上 的 当前 样本 点 oe € 
X,-1。 对 于 历史 样本 集 X, 的 构建 与 更 新 ,AIMH 算法 采用 的 方案 是 :假定 候选 样 
Jk y ~ q C Xn) s 如 果 该 样本 被 独立 链接 受 为 新 样本 ,那么 将 xz 添加 到 历史 
样本 集 X,-: 中 构成 新 的 集合 X, ;否则 将 候选 样本 y 添加 到 历史 样本 集 X carp 
成 新 的 集合 X, AIMH 算法 描述 如 下 : 
CD 初始 化 样本 状态 eO ,转移 核 参 数 02 s 
(2) 初始 化 历史 样本 集 XSD; 
(3) For i=1 to N—1 
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一 使 用 提议 分 布 gw(。|X;) 抽 取 一 个 候选 样本 y; 
一 计算 Metropolis-Hastings 接受 比 a(y,.x® ,Xi;) 


fq? G9? | X) 
f(a? q9 Cy | Xx | 


- 以 概率 a(y,x”,X;) 接 受 y 为 新 样本 , 令 ze 二 y; 否 则 拒绝 y, 并 令 
ctv = o 
- 若 y 被 接受 , 则 令 Xa SXU h EWS Xi SXU ly}. 
End For. 
338 2.2. 自 适应 独立 Metropolis-Hastings 算法 构建 的 马 氏 链 收 敛 于 目标 分 
布 f, 亦 即 , 如 果 pi (2? | Xi) m fr? ) BAA pia? IXS fat), 
Holden 等 人 0 证 明了 AIMH 算法 构建 的 独立 链 以 目标 分 布 f 为 其 极限 平 
稳 分 布 。 记 P,(X,) 为 马 氏 链 在 第 次 迭代 时 历史 样本 集 的 联合 分 布 ,w 为 第 十 
1 次 迭代 时 添加 到 历史 样本 集 X, 中 的 样本 。 事 实 上 ,假定 pr” Xa = f 
Cr? ) , Wn 
baa (x? | Xp) B, Xn) = Bua OG Uf Cw) qG” Crt? | X art? yu， 
Xi) 


aC ya? ,X;) min[1. (2. 36) 


Je Catt9 599 Cio | X.) CI Se ow, es 
Xe-1))} 
= Pu-i (Xu) Cf Get? )g9 (wl X4) +f Cw Cat? | X, alrt ow, 
X,-1) 
= fC j (wl X,-2:)aGw,z9*? ,X,-1)} 
= f(a? Yq (w| X, P, OX) 
因而 pCa? | X,) m f(a?) EM 2.2 得 证 。 


2.4.2 目标 分 布 自 适应 


在 自 适应 MCMC 算法 簇 中 ,有 一 类 算法 在 构建 马 氏 链 时 并 不 考虑 自 适 应 调整 
和 学 习 转 移 核 ,而 是 自 适应 的 更 新 目标 分 布 自身 。 也 就 是 说 ,这 类 算法 试图 在 采用 
过 程 中 迭代 地 更 新 其 试验 分 布 (Trial Distribution) ,使 马 氏 链 最 终 收 敛 于 目标 分 
布 。 我 们 称 这 类 算法 为 基于 目标 分 布 自 适应 的 MCMC 算法。 这 类 自 适应 算法 的 
典型 代表 包括 :Multicanonical 采样 算法 [5 , Wang-Landau 算法 ,广义 Wang- 
Landau £i"? jtf L3 t MCMC(SAMC) 算 法 [等 。 本 节 主 要 介绍 前 两 个 算 
法 ,将 在 第 3 章 中 详细 介绍 随机 冯 近 MCMC 采样 算法 及 其 在 视觉 跟踪 中 的 应 用 。 
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事实 上 ,Wang-Landau 算法 ,广义 Wang-Landau 算法 可 以 看 作 是 Multicanon- 
ical 采样 算法 的 变 体 , 区 别 在 于 如 何 构建 试验 分 布 以 及 所 采用 的 学 习 策略 。 值 得 
注意 的 是 ,此 类 算法 构建 试验 分 布 的 初衷 是 为 了 克服 传统 MCMC 算法 (包括 简单 
的 Gibbs 采样 和 Metropolis-Hastings 算法 ) 在 对 复杂 多 模 的 目标 分 布 采样 时 往往 
易于 陷入 局 部 模式 的 缺陷 ,这 类 算法 常用 于 解决 统计 物理 学 中 一 些 物理 量 的 模拟 
和 计算 ”3 。 类 似 于 前 面 介 绍 的 基于 提议 分 布 自 适应 的 MCMC 算法 ,基于 目标 
分 布 自 适应 的 MCMC 算法 也 利用 马 氏 链 上 的 历史 样本 信息 ,来 更 新 和 指导 试验 分 
布 的 学 习 。 

假定 目标 分 布 f 可 以 表示 为 仅 差 一 个 比例 常数 c 的 已 知 分 布 , 即 

fla) = cpl) t E X (2.37) 

He A AFER RH. WUS — logp (x) , 它 在 物理 学 中 表示 分 布 p(x) 对 应 的 能 
量 函 数 。 当 目标 分 布 的 能 量 地 形 (Energy Landscape) Wy IK ANF (rugged) HT . 14 4 
的 MCMC 采样 算法 往往 表现 出 混合 性 差 ,长 时 间 停 留 在 某 个 局 部 模式 难以 靠近 或 
到 达 全 局 最 优 模式 。1991 年 ,Berg 和 Neuhaust 提 出 了 用 于 一 阶 相 变 过 程 中 态 密 
度 (Density of States. DoS) 估 计 的 一 种 MCMC 采样 算法 。 

1. Multicanonical 采样 算法 

在 物理 学 中 , 态 密度 也 称 为 光谱 密度 (Spectral Density) , 它 用 于 描述 一 个 系统 
中 每 一 能 量 阶 对 应 的 能 量子 区 域 (Subregion) 中 可 用 状态 的 数目 。 某 个 特定 能 量 
阶 的 DoS 较 高 ,意味 着 对 应 子 区 域 有 较 多 的 可 用 状态 。 态 密度 的 估计 有 助 于 对 其 
他 物理 量 的 估计 和 计算 , 它 在 物理 中 也 用 于 解释 许多 量子 力学 现象 1。 

假设 使 用 Multicanonical 采样 算法 从 一 个 正则 系 综 (Ensemble) 抽 取样 本 。 系 
统 的 每 一 个 位 型 (Configuration)x 都 被 赋予 一 个 权重 w: 


wlu) 一 -L =e (2.38) 


式 中 ,u 二 U(x) 表 示 位 型 x WAER «S GO PROS GE WU REER. n i FA PH A 
3K (2, 38) 进 行 随机 模拟 ,将 使 能 量 的 分 布 pC) 9g Ge (Qu) ~~1。 这 也 意味 着 这 种 
随机 采样 将 在 能 量 空间 进行 随机 游 走 ,并 能 够 访问 到 能 量 空间 的 各 个 子 区 域 。 同 
时 ,由 此 产生 的 样本 在 能 量 空间 中 形成 一 个 平 直 的 直方 图 ,因而 Multicanonical 算 
法 也 称 为 平 直 直方 图 (Flat Histogram) RRR HA., 

现在 考虑 离散 状态 空间 的 情形 。 在 此 情况 下 位 型 x 的 能 量 可 以 在 有 限 个 能 量 
阶 中 取 值 , 即 U (x) € Ga ,ws，… ,un)。 假 定 在 第 次 迭代 后 抽取 的 样本 序列 为 
{2 JL id nr) = # (x? Ul? —u)) . uj 
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lim nri) — 


n= n sou 
式 中 ,2Z(T) 为 配 分 函数 ,了 T 为 系统 的 温度 。 因 而 态 密度 可 以 按 下 式 进行 估计 : 


ny (Gi) es/T 


glu) = ——— — ——,i = 1,2,-,m (2. 40) 
Sare 
Multicanonical 采样 算法 分 多 个 阶段 进行， 在 完成 一 个 阶段 采样 后 ,更 新 一 次 
态 密度 项 ,也 就 是 权重 项 。 整 个 采样 过 程 的 算法 描述 如 下 : 
(1) 初始 化 态 密 度 go (u;) ,i 二 1,2,…,m;s 二 0; 
(2) For s—1 to N 


— 使 用 Metropolis-Hastings 算法 从 权重 函数 w Cao rp illo N, 个 样 


z——gGae*sT,i—1,2..m (2. 39) 


本 ,其 中 
w? C) = — (2.41) 


g (UC) 
- 重新 估计 态 密度 
gea Gu) = clf G) c ag, Qu i = 1.2.0 5m, (2. 42) 
AP. g ORRE i 个 能 量 阶 的 相对 采样 频率 ;a; 为 平滑 项 ;常数 < 
确保 所 估计 的 态 密度 值 在 有 效 的 范围 内 。 
End For. 

Multicanonical 采样 算法 的 有 效 性 依赖 于 其 态 密 度 的 学 习 机 制 。 事实 上 ， 
Multicanonical 采样 算法 对 态 密 度 的 估计 通常 只 能 取得 有 限 的 统计 精度 , 当 采 样 到 
达 一 定 阶段 之 后 ,继续 增加 采样 阶段 或 采样 次 数 将 无 助 于 态 密度 估计 的 进一步 
BE , 

2. Wang-Landau 采样 算法 

Wang-Landau 算法 是 Multicanonical 采样 算法 的 一 个 变 体 ,两 者 的 主要 区 别 
在 于 估计 态 密度 的 学 习 算 法 不 同 。 在 随机 区 近 的 理论 框架 下 ,两 者 都 可 以 看 作 
Robbins-Monro 算法 505 的 一 个 特例 , Wang-Landau 算法 采用 的 学 习 策 略 较 之 
Multicanonical 算法 采样 更 为 有 效 , 因 而 对 态 密度 的 估计 能 够 取得 更 好 的 统计 精 
度 。Wang-Landau 算法 的 最 重要 的 一 个 特征 是 能 够 有 效 地 避免 在 采样 过 程 中 陷 
和 人 局 部 能 量 极 小 点 ,这 个 特征 对 于 具有 复杂 能 量 地 形 特点 的 物理 系统 来 说 至 关 重 
要 。 近 年 来 , 它 在 统计 物理 学 中 得 到 了 极为 广泛 的 应 用 ,已 成 为 用 于 态 密度 等 物理 
量 估计 的 最 重要 、 最 常用 的 统计 计算 方法 之 一 。 

假设 使 用 Wang-Landau 算法 从 一 个 正则 系 综 抽 取样 本 。 为 系 综 的 每 一 个 位 
型 过 都 赋予 一 个 权重 w: 
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wG) ~ (2. 43) 


glu) 
AP u=U GO ,表示 位 型 zx 的 能 量 阶 ;g (4) 为 态 密度 。 在 离散 状态 空间 中 ,位 型 x 
的 能 量 可 以 在 有 限 个 能 量 阶 中 取 值 , 即 Uae) © Gua suo us) Multicanonical 算 
法 类 似 , Wang-Landau 算法 也 包括 多 个 采样 阶段 。 在 每 个 采样 阶段 中 ,迭代 地 使 
用 Metropolis-Hastings 算法 抽取 样本 序列 直到 在 能 量 空间 中 获得 一 个 平 直 直 方 
图 为 止 , 然 后 采样 进入 下 一 个 阶段 。 如 果 每 个 能 量 阶 的 采样 频率 不 低 于 能 量 阶 的 
平均 采样 频率 的 80 26 , 则 这 个 直方 图 被 认为 是 平 直 的 。 一 旦 获得 一 个 平 直 的 直方 
图 ,算法 就 对 态 密度 学 习 的 增益 因子 进行 更 新 ,通常 是 选择 渐 减 的 一 个 增益 因子 序 
列 。 算 法 重复 进行 这 样 的 采样 过 程 ,直到 增益 因子 接近 于 1。Wang-Landau 算法 
描述 如 下 : 
COD 初始 化 8.6; 态 密度 g(u) 一 1 一 1.2,…,7; 


(2) Repeat 
— Repeat 
- 使 用 Metropolis-Hastings 算法 从 试验 函数 fu Cx) ril — PE 
本 xz, 其 中 
PS AUG» (2. 44) 
- 更 新 态 密度 
glu) = g(u,)g "7v ,j = 1,2,**,m (2.45) 
- Until 获得 一 个 平 直 的 能 量 直 方 图 ; 
-SA 
Until £e 


尽管 Wang-Landau 采样 算法 在 对 许多 物理 系统 的 随机 模拟 与 计算 中 取得 了 
很 大 的 成 功 ,但 是 至 今 还 没有 充足 的 理论 证 实 它 的 收敛 性 ,而 且 在 一 些 统计 计算 中 
已 经 发 现 它 只 能 取得 有 限 的 统计 精度 ,也 就 是 说 当 采 样 达 到 一 定 阶段 之 后 ,持续 的 
迭代 采样 不 能 进一步 改进 统计 量 的 估计 精度 中。Liang 等 人 中研 究 了 Wang- 
Landau 算法 的 缺陷 与 不 足 , 并 指出 其 主要 原因 在 于 增益 因子 的 设计 与 选择 策略 。 
紧 接 着 ,Liangm -扩展 并 提出 了 一 个 广义 的 Wang-Landau 算法 。 这 种 扩展 主要 包 
括 :将 离散 空间 推广 到 连续 空间 ;引入 能 量 空间 划分 的 概念 ;以 及 更 为 有 效 的 增益 
因子 更 新 策略 。 随 后 ,Liang 4A ye pi pE UE He ESR BO Ee AB 
进 了 广义 Wang-Landau 算法 ,确保 算法 在 理论 上 的 收敛 性 ,使 算法 的 应 用 范围 延 
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展 到 物理 学 以 外 的 一 些 统计 计算 领域 ,例如 模型 选择 、 高 后 验 区 间 估 计 、 随 机 优 
化 等 。 


4» 2.5 MCMC 采样 方法 在 计算 机 视觉 中 的 应 用 «4» 


本 节 主 要 介绍 MCMC 采样 方法 在 计算 机 视觉 中 的 应 用 。 特 别 地 ,探讨 了 它们 
在 目标 轮廓 近似 表示 中 的 应 用 。 在 随机 优化 的 框架 下 ,提出 了 一 种 基于 Monte 
Carlo 全 局 优化 的 用 于 轮廓 表示 的 多 边 形 近 似 (Polygonal Approximation) $f 3307? 
和 一 种 基于 自 适应 MCMC 采样 的 多 边 形 近 似 算法 中 。 实 验 表明 ,提出 的 算法 与 
同类 的 主流 算法 相 比 具 有 更 好 的 近似 精度 代价 比 。 


2.5.1 目标 轮廓 的 多 边 形 近 似 


多 边 形 近似 是 图 像 目标 轮廓 近似 表示 的 一 种 重要 方法 , 它 在 计算 机 视觉 .模式 
识别 .信号 处 理 等 领域 有 着 重要 的 应 用 。 在 多 边 形 近似 算法 中 ,一 条 封闭 的 平面 曲 
线 被 分 割 成 首尾 连接 的 一 系列 线段 ,这 些 连 接 的 线段 构成 一 个 多 边 形 近似 地 表示 
这 条 封闭 曲线 。 多 边 形 近似 方案 的 优点 在 于 通过 尽 可 能 地 保留 轮廓 曲线 的 关键 特 
征 而 忽略 那些 元 余 的 曲线 点 ,从 而 节省 存储 空间 并 减低 在 应 用 中 的 处 理 计算 代价 。 
同时 , 它 可 以 通过 增 减 特征 点 来 平衡 近似 方案 的 性 价 比 , 即 近 似 精 度 与 计算 (或 存 
储 ) 代 价 的 平衡 ,因而 具有 较 好 的 灵活 性 。 

对 于 一 条 封闭 的 平面 数字 曲线 ,多 边 形 近 似 问题 可 以 归 为 两 类 , 即 最 小 近似 错 
误 Cmin 一 e) 问 题 和 最 小 线段 数目 (min 一 # ) 问 题 。 前 者 的 任务 是 在 给 定 线段 数目 
的 前 提 下 寻找 一 个 具有 最 小 近似 错误 的 多 边 形 ,后 者 的 任务 是 在 给 定 最 大 允许 近 
似 错误 的 情况 下 寻找 一 个 具有 最 少 线段 数 的 多 边 形 。 对 于 多 边 形 近似 问题 , 现 有 
的 处 理 方法 大 致 可 以 归 为 两 大 类 :基于 局 部 搜索 的 算法 ?2 和 基于 全 局 搜索 的 
针尖 

局 部 搜索 的 方法 主要 是 利用 曲线 在 数据 点 (Data Point) 的 局 部 信息 ,比如 曲率 
等 信息 ,迭代 地 寻求 局 部 最 佳 近似 方案 。 局 部 搜索 方法 的 典型 代表 包括 分 裂 -合并 
(Split-and-Merge) $$. 法 905、 控制 点 检测 (Dominant-point Detection) 算 法 Ga 等 。 
分 裂 -合并 算法 交互 地 对 一 个 随机 的 初始 近似 多 边 形 迭代 地 进行 分 裂 与 合并 操作 ， 
直到 获得 算法 所 能 取得 的 最 佳 方案 为 止 。 在 每 一 个 分 裂 阶段 ,多 边 形 的 一 条 线段 
被 其 对 应 弧 上 的 某 个 数据 点 分 型 为 两 条 连接 的 线段 。 执 行 分 裂 操作 的 数据 点 的 选 
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择 依赖 于 一 个 策略 :在 所 有 数据 点 中 选择 一 个 距离 其 对 应 线段 最 远 的 一 个 作为 分 
裂 点 。 而 在 每 一 个 合并 阶段 ,多边 形 中 某 两 条 互相 连接 的 线段 被 合并 成 一 条 线段 ， 
并 在 多 边 形 中 删除 该 顶点 以 及 与 其 相连 的 两 条 线段 。 删 除 点 的 选择 准则 是 :在 多 
边 形 的 所 有 顶点 中 选择 一 个 离合 并 后 线段 距离 最 近 的 顶点 。 一 般 来 说 ,分 裂 一 合 
并 算法 对 近似 多 边 形 的 初始 方案 比较 敏感 ,因而 它 获得 的 近似 方案 可 能 与 实际 最 
佳 方案 相去 其 还。 控制 点 检测 算法 的 基本 思想 是 通过 对 曲线 的 局 部 属性 (主要 指 
的 是 曲率 ) 分 析 , 获 得 一 系列 控制 点 ,以 此 来 构建 一 条 近似 多 边 形 。 这 种 算法 的 近 
似 性 能 与 曲线 的 局 部 信息 提取 有 很 大 的 关系 ,局 部 信息 的 精度 对 近似 方案 有 关键 
性 的 影响 。 

不 同 于 局 部 搜索 方法 ,基于 全 局 的 近似 方法 试图 通过 全 局 搜索 获得 全 局 最 佳 
多 边 形 近似 方案 。 基 于 全 局 的 搜索 算法 主要 是 基于 元 启发 (Meta-Heuristics ) 的 方 
式 , 包 括 :基于 遗传 的 近似 算法 55532371 .基于 粒子 群 优化 的 近似 算法 05 以 及 基于 蚁 
群 优化 的 算法 中等。 实践 证 明 ,基于 元 启发 的 全 局 近似 算法 在 多 边 形 近 似 中 能 够 
取得 较 好 的 近似 精度 代价 比 。 一 般 来 说 .在 近似 精度 方面 ,基于 全 局 搜索 的 方法 比 
基于 局 部 搜索 的 算法 表现 更 佳 ,并 且 对 初始 方案 不 敏感 ;但 是 全 局 搜索 往往 需要 更 
大 的 计算 代价 。 因 而 ,一 个 有 效 的 近似 算法 需要 在 近似 精度 与 计算 代价 之 间 求 得 
一 种 平衡 ,取得 最 佳 的 近似 精度 代价 比 。 事 实 上 ,多 边 形 近 似 问 题 可 以 通过 动态 规 
划 等 一 些 方法 求 得 精确 的 最 佳 方案 09 ,然而 这 种 方法 通常 需要 付出 极 高 的 计算 代 
价 , 而 这 在 实际 应 用 中 通常 是 不 可 行 的 ,尤其 对 于 有 着 大 数据 点 的 数字 曲线 近似 
问题 。 

本 节 将 MCMC 采样 方法 引入 到 多 边 形 近似 中 ,提出 一 种 基于 Monte Carlo 优 
化 的 多 边 形 近 似 算法 中 和 一 种 基于 自 适应 MCMC 采样 的 多 边 形 近似 算法 D29 。 
在 介绍 提出 的 算法 之 前 ,我 们 先 给 出 多 边 形 近似 的 问题 定义 。 

S Ci (prs poet p, RAR AAA n 个 有 序数 据点 的 封闭 平面 曲线 ,其 中 pi 
三 p,。 记 这 条 数字 曲线 的 多 边 形 近 似 方案 为 P:z 二 (xi,xs，… ,x,), 任 一 候选 方案 
x 为 一 个 二 值 向 量 (Binary Vector) ,其 中 

1 peer 
^ do 其 他 

于 是 ,两 类 多 边 形 近似 问题 可 以 定义 为 : 

min 一 se: 给 定 一 条 平面 数字 曲线 C: Cp s pests Pa) ,以 及 固定 的 多 边 形 顶 点 数 
mm， 寻找 一 个 多 边 形 P:x, 使 得 在 所 有 可 能 的 近似 方案 里 该 多 边 形 与 曲线 C 之 间 有 
最 小 的 近似 错误 ; 


(2. 46) 
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min— # :给 定 一 条 平面 数字 曲线 C: (prs po 0 WAT WR IRE BR 
找 一 个 多 边 形 P:x, 使 得 在 所 有 可 能 的 近似 方案 里 该 多 边 形 的 顶点 数 最 少 。 

多 边 形 近 似 问 题 中 ,通常 用 积分 平方 错误 (Integral Square Error. ISE) 来 度量 
多 边 形 与 曲线 间 的 近似 错误 。 令 所 Pj 一 (pi,pin，…,p;) 表 示 起 点 和 终点 分 别 为 pi 
All p; 的 顺 时 针 方 向 上 曲线 的 一 段 弧 ,iPj; 表 示 连 接 数 据点 pi 和 pj; 的 一 条 线段 ,qd 
(pr，PiP7) 表 示 数 据点 p, 与 线段 557 之 间 的 垂直 距离 。 于 是 ,近似 错误 ISE 可 以 表 
示 为 


EED bib = >) d'Gi bib) (2. 47) 
DOT 
常用 的 多 边 形 近似 方案 度量 准则 包括 压缩 比 和 轮廓 应 用 。 
(1) 压缩 比 (Compression Ratio, CR): 


CR=24 (2. 48) 


Na 
式 中 ,n 为 曲线 的 数据 点 个 数 ;na 为 近似 多 边 形 的 顶点 个 数 。 使 用 较 少 顶点 的 多 边 
形 近似 能 获得 高 的 压缩 比 , 但 是 其 近似 精度 可 能 较 低 。 
(2) 轮廓 效用 (Figure of Merit. FOM): 
Sarkar04 提 出 将 压缩 比 与 近似 错误 两 种 度量 结合 起 来 评价 近似 方案 , 即 
rom=<8 (2. 49) 
在 实际 应 用 中 ,FOM 和 ISE 是 较 常 用 的 度量 标准 。 对 于 mine 问题 ,由 于 各 
种 方案 都 使 用 固定 的 多 边 形 顶 点 数 ,因而 度量 比较 简单 ,只 需要 比较 不 同方 案 之 间 
的 ISE 即 可 ;而 对 于 min 一 # 问 题 ,可 通过 比较 FOM 值 评价 不 同 的 方案 ,FOM f 
越 大 其 性 价 比 越 好 。 


2.5.2 基于 MC 优化 的 多 边 形 近 似 算法 


1. 方法 介绍 
在 离散 优化 的 框架 下 ,两 类 多 边 形 近似 问题 可 以 形式 化 地 描述 为 : 
(1) min 一 e: 给 定 一 条 数字 曲线 C: (prs posts Pn WRB IG DAR m, FAK 
满足 下 式 的 方案 v: 
x = argmin, ISECr.C) .s. t. Ma, = m and x; € (0.1) (2.50) 


(2) min— # :给 定 一 条 数字 曲线 Ci (pi,ps，…,p,), 以 及 近似 错误 上 限 s, 寻 
找 满足 下 式 的 方案 x: 
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= argmin, >) z; ss. $ ISE(x,C) «e and x; € (0,1) (2, 51) 
i 一 1 


两 类 多 边 形 近似 问题 都 属于 带 约束 的 离散 优化 问题 。 本 节 将 基于 MC 采样 的 全 局 
优化 和 基于 分 裂 -合并 过 程 的 局 部 优化 相 结合 ,提出 一 种 混合 的 离散 优化 算法 来 处 
理 两 类 多 边 形 近似 问题 。 在 提出 的 算法 中 ,通过 使 用 分 裂 -合并 过 程 去 除 两 类 优化 
问题 的 约束 条 件 , 从 而 把 约束 优化 转化 为 无 约束 的 离散 优化 问题 。 令 f(x) 表示 离 
散 优化 的 目标 代价 函数 ,其 中 xz 代表 满足 约 东 条件 的 可 行 解 (方案 ), 则 两 类 优化 问 
题 可 以 统一 表示 为 
r-—argmin,f (x).x€ AX (2,52) 

式 中 ,化 表示 可 行 解 空间 。 

我 们 考虑 采用 随机 优化 方法 解决 式 (2. 52) 的 离散 优化 问题 。 特 别 地 ,我 们 采 
用 基于 Basin-Hopping 采样 2 的 MC 优化 方法 。 当 应 用 于 全 局 优化 问题 时 , MC 
方法 的 有 效 性 高 度 依 赖 于 它 是 否 能 够 在 采样 中 避免 陷入 局 部 模式 ,并 能 够 在 低能 
量 区 域 进行 有 效 的 采样 。 在 实际 应 用 中 ,目标 分 布 的 能 量 地 形 往往 是 崎 邮 不 平 的 ， 
其 中 有 很 多 高 能 量 屏障 (Barrier) ,这 使 许多 优化 和 随机 优化 方法 难以 翻越 这 些 能 
量 屏障 达到 或 靠近 全 局 最 近 模 式 。Basin-Hopping 采样 通过 在 每 次 MC 采样 步骤 
中 幅 入 一 个 局 部 优化 过 程 ,来 消除 能 量 地 形 中 的 高 能 量 屏障 ,使 最 终 的 采样 在 一 个 
更 为 “平坦 ”的 能 量 地 形 上 进行 ,从 而 避免 采样 陷入 局 部 模式 ,进而 提高 采样 效率 。 
从 随机 优化 的 角度 来 看 ,这 种 采样 方式 使 得 对 低能 量 区 域 的 搜索 变 得 更 为 容易 , 增 
加 了 靠近 或 达到 全 局 最 低能 量 点 的 机 会 。Basin-Hopping 采样 方法 在 统计 物理 和 
固体 物理 学 中 有 着 广泛 的 应 用 ,我 们 首次 将 这 种 采样 方法 引入 到 多 边 形 近似 问题 
中 ,并 提出 一 种 结合 分 裂 -合并 操作 的 混合 优化 算法 来 解决 两 类 多 边 形 近似 问题 。 

在 优化 的 初始 阶段 ,随机 选择 一 个 初始 的 多 边 形 近 似 方案 。 从 初始 点 工 开始 ， 
执行 一 次 基于 分 裂 -合并 的 局 部 优化 过 程 ,状态 从 x 移动 到 局 部 能 量 极 小 点 min 3 
然后 通过 一 个 提议 分 布 ,状态 跳跃 到 一 个 新 的 方案 点 x ,然后 再 执行 一 次 局 部 优化 
过 程 后 到 达 一 个 新 的 局 部 极 小 点 zun。 最 后 ,算法 通过 计算 Metropolis 接受 率 a: 


Gri) 
qx ) CAE [KT 


S ae ) 
FE. AE min f Gus — f Gras ;Ks HERAA ST. 为 系统 的 温度 。 算 法 的 一 
次 采样 过 程 如 图 2-2 Brzs. ER FE ERE rp n] DLE A LG AO) $9 p R RT EE 
温度 工 ,然而 在 我 们 的 算法 中 使 用 的 提议 分 布 是 全 局 跳跃 的 ,因而 KsT 项 的 影响 
可 以 忽略 。 因 而 ,接受 率 a 改写 为 : 


a= min| 1 (2. 53) 
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g= min(1, 1E je] (2.54) 


qG ix) 


原始 势能 表面 


变换 后 的 势能 表面 


=- 


图 2-2 Basin-Hopping 采样 方法 示意 。 原 始 的 势能 表面 经 局 部 优化 后 
变 成 更 为 平坦 的 阶梯 形 的 能 量 地 形 分 布 , 使 得 MC 采样 更 易于 
跨越 高 能 量 屏障 ,避免 陷入 局 部 模式 。 
两 类 多 边 形 近似 问题 的 MC 优化 算法 描述 如 下 : 
CD 在 可 行 解决 方案 中 随机 生成 一 初始 方案 zx; 
(2) 运行 一 个 基于 分 裂 或 合并 操作 的 局 部 优化 获得 一 个 极 值 点 miss 
(3) Fori=ltoN //N 表示 采样 次 数 
- 基于 分 裂 -合并 的 提议 分 布 g 生成 一 个 新 的 方案 x'; 
- 运行 一 个 基于 分 裂 或 合并 操作 的 局 部 优化 获得 一 个 极 值 点 rain 
— 按照 式 (2.54) 计 算 接受 比 a; 
- 以 概率 a 接受 方案 oc! ; 若 方案 z 被 接受 , 则 nm v ianuis = E min s HI, 
保留 z,z' 不 变 ; 


End For 

(4) x* —argmin,o f(r) ,ij—1,2,*. N, 

算法 中 的 局 部 优化 过 程 是 基于 多 边 形 的 分 裂 或 合并 操作 的 。 局 部 优化 的 任务 
是 把 从 一 个 初始 方案 点 移动 到 该 点 附近 的 能 量 极 小 点 。 多 边 形 的 分 裂 操 作 描 述 如 
下 :给 定 一 个 待 分裂 的 数据 点 p, 把 点 p 所 在 的 弧 分 割 成 两 段 弧 , 然 后 把 数据 点 p 
加 入 到 多 边 形 顶点 集中 ,并 连接 点 p 与 相 邻 两 多 边 形 项 点 ,并 把 两 条 边 加 入 到 多 边 
形 中 。 分 裂 操 作 通过 增加 多 边 形 的 项 点数 来 降低 近似 错误 ISE。 多 边 形 的 合并 操 
作 描 述 :给 定 一 个 待 合并 的 多 边 形 项 点 p, 把 点 p 以 及 与 其 相连 的 两 条 边 从 多 边 形 
中 删除 ,并 把 与 删除 点 相 邻 的 两 个 多 边 形 顶点 相连 。 合 并 操作 通过 删除 多 边 形 的 
顶点 来 增加 近似 方案 的 压缩 比 ,但 同时 加 大 了 近似 错误 ISE。 多 于 两 类 多 边 形 近 
似 问题 ,它们 对 应 的 局 部 优化 过 程 也 不 一 样 , 我 们 分 别 加 以 讨论 : 
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对 于 min 一 e 问题 ,局 部 优化 描述 :给 定 一 个 初始 方案 点 ,局 部 优化 可 通过 执行 
一 系列 的 分 裂 -合并 过 程 ,直到 获得 局 部 能 量 极 小 点 。 在 这 个 过 程 中 分 裂 操 作 和 合 
并 操作 是 成 对 出 现 的 , 即 每 一 次 分 裂 操 作 之 后 执行 一 次 合并 操作 。 在 分 橡 操作 中 ， 
分 裂 点 的 选择 原则 是 :选择 一 个 数据 点 ,使 在 此 处 的 分 裂 将 导致 ISE 值 降低 幅度 最 
大 。 在 合并 操作 中 ,合并 点 的 选择 原则 是 :选择 一 个 顶点 ,使 在 此 处 的 合并 操作 将 
导致 ISE 值 增加 幅度 最 小 。 值 得 注意 的 是 ,如 果 初 始 方案 是 在 可 行 解 空 间 中 ,那么 
基于 分 型 -合并 操作 的 局 部 优化 过 程 不 会 改变 方案 的 可 行 性 ,使 方案 仍然 属于 可 行 
解 空间 ,这 是 由 于 分 裂 -合并 操作 不 会 改变 多 边 形 的 顶点 数 。 

对 于 min 一 # 问题, 局 部 优化 过 程 基于 一 系列 合并 或 分 裂 操 作 ,但 这 两 种 操作 
并 非 成 对 出 现 。 在 优化 过 程 中 ,一 系列 的 合并 或 分 裂 操 作 可 能 导致 候选 方案 不 再 
属于 可 行 解 空间 ,因而 需要 考虑 方案 修复 。 方 案 修复 同样 也 是 基于 合并 或 修复 操 
作 。 局 部 优化 算法 描述 如 下 : 

CD 给 定 初始 方案 zx, 近似 错误 上 界 e; 

(2) If f(x)>e then 

Repeat 
- 在 数据 点 x 处 执行 分 裂 操 作 ; 
Until f(x)<e 
End If 

(3) Fa" =r, 对 方案 执行 一 次 合并 操作 ; 

OD 若 f(x) 之 e, 则 返回 局 部 最 佳 方案 x ;否则 转 (3)。 

在 提出 的 MC 优化 算法 中 ,使 用 提议 分 布 进行 随机 跳跃 ,从 一 个 方案 点 跳跃 到 
方案 空间 中 的 另 一 个 候选 方案 点 。 随 机 跳跃 对 MC 优化 算法 有 重要 影响 ,在 我 们 
的 算法 中 ,这 种 随机 跳跃 是 基于 分 型 -合并 操作 实现 的 。 有 别 于 局 部 优化 过 程 中 对 
分 裂 点 和 合并 点 的 选择 的 是 确定 性 的 ,随机 跳跃 中 对 分 裂 点 和 合并 点 的 选择 基于 
一 个 权重 系数 (概率 ) 。 下 面 介 绍 在 提议 分 布 g 中 分 裂 点 和 合并 点 的 选择 原则 : 

CD 分 裂 。 在 选择 分 裂 点 时 ,采样 算法 倾向 于 寻找 一 个 “理想 ?的 数据 点 进 
行 分 裂 。 对 每 个 不 在 多 边 形 中 的 数据 点 户 , 首 先 计算 其 与 对 应 多 边 形 边 的 垂直 
距离 以 ,然后 以 概率 w;, 即 


C n (2.55) 
dil (x; = 0) 
HE 


选择 数据 点 p. 为 分 裂 点 。 其 中 ,TI 为 示 性 函数 。 这 一 分 裂 点 选择 方案 倾向 于 距离 
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多 边 形 边 较 远 的 数据 点 。 在 实际 应 用 中 ,也 可 以 考虑 选择 倾向 于 有 最 大 ISE 降幅 
的 分 裂 点 ,但 是 这 种 方式 考虑 的 还 是 能 量 的 增 减 ,直接 倾向 于 在 低能 量 区域 产 生 样 
本 点 不 一 定 有 利于 产生 全 局 的 随机 跳跃 ,因而 我 们 考虑 前 一 种 方案 ,即使 用 距离 而 
不 是 直接 使 用 能 量 来 度量 权重 。 

(2) 合并 。 在 产生 一 个 分 裂 点 之 后 , 紧 接 着 需要 产生 一 个 合并 点 。 对 每 个 多 
边 形 顶点 pi, 首 先 计算 其 与 待 添加 的 多 边 形 边 (连接 与 合并 点 相 邻 的 两 个 顶点 的 一 
条 边 ) 的 垂直 距离 di ,然后 以 概率 w» BI 

d 


[S (2. 56) 
add Gs = 1) 


选择 数据 点 p; 为 合并 点 。 其 中 ,了 为 示 性 函数 。 合 并 点 选择 方案 倾向 于 距离 多 边 

2. 实验 结果 

为 评估 提出 的 算法 在 解决 两 类 多 边 形 问 题 中 的 性 能 ,实验 中 使 用 了 一 个 公用 
数据 集约 。 数 据 集 包 含 了 用 于 测试 多 边 形 近 似 方案 的 几 组 目标 轮廓 点 集 : 
Figure-8. Chromosome.Semicircle. Leaf 等 。 

在 实验 中 ,我 们 将 使 用 的 算法 与 当前 几 种 主流 的 多 边 形 近似 算法 基于 遗传 算 
法 的 多 边 形 近 似 算法 ”站 以 及 基于 局 部 搜索 的 控制 点 检测 算法 9 汐 进 行 了 比较 : 
在 我 们 的 算法 中 ,采样 的 样本 数目 设置 为 200 ,而 在 多 边 形 近似 算法 553s9 中 ,种群 
(Population) 大 小 和 代 (Generation) 的 数目 均 设 置 为 100。 多 边 形 近似 算法 和 我 们 
的 算法 都 属于 基于 随机 优化 算法 ,它们 在 每 个 测试 用 例 上 都 独立 运行 10 次 ,实验 
中 给 出 的 结果 是 10 次 运行 中 的 最 佳 结 果 。 实 验 所 选用 的 评估 准则 是 ISE 度量 和 
FOM 度量 ,这 两 种 度量 在 多 边 形 近 似 问题 中 得 到 了 广泛 的 应 用 ,是 评估 多 边 形 近 
似 算法 的 最 常用 的 标准 度量 方式 。 表 2-1 和 表 2-2 给 出 了 不 同 的 多 边 形 近 似 算法 
在 测试 集 上 的 实验 结果 ;图 2-3 给 出 了 MC 优化 算法 在 测试 集 上 的 部 分 实验 结果 。 


表 2-1 min 一 # 问 题 的 算法 结果 比较 


Shape Method € m ISE FOM 
Wang [136] 6 8 5.90 0. 953 

proposed 8 5. 90 0. 953 

Wang [136] 10 và 7.83 0. 821 

Figure-8 

proposed 7 7.83 0. 821 

Wang [136] 20 6 17.83 0. 421 

proposed 6 17.49 0. 429 
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续 表 

Shape Method e m ISE FOM 
Wang [136] 8 1 7.42 0. 735 
proposed in] 7:24 0. 743 
Wang [136] 10 10 8.07 0. 743 
Cicadas asia 10 8.07 0. 743 
Wang [136] 20 7 17.68 0. 485 
proposed 7 17.68 0. 485 
Wang [136] 30 6 23. 73 0. 421 
proposed 6 23. 73 0. 421 
Wang [136] 20 14 18.16 0. 401 
proposed 14 17.39 0. 419 
NUN Wang [136] 30 12 27.28 0. 312 
proposed 12 26.06 0. 326 
Wang [136] 60 10 46.18 0. 221 
proposed 10 46.00 0. 222 

表 2-2 min—e 问题 的 算法 结果 比较 
Shape Method m ISE FOM 
Chen [135] 22 7.19 0. 645 
Masood [133] 8.61 0.538 
Wang [136] 7.04 0. 659 
proposed 7.01 0. 661 
Chen [135] 26 4.73 0. 829 
Seda Masood [133] 4. 91 0. 799 
Wang [136] 4.05 0. 969 
proposed 4.05 0.969 
Chen [135] 27 3.74 1.010 
Masood [133] 4.40 0. 859 
Wang [136] 3.70 1.021 
proposed 3.70 1.021 
Chen [135] 23 9.87 0. 529 
Masood [133] 10.61 0. 492 

Leaf 

Wang [136] 9.53 0.547 
proposed 9.46 0.552 
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续 表 
Shape Method m ISE FOM 
Chen [135] 32 4.68 0. 801 
Masood [133] 4.97 0. 755 
Leaf 
Wang [136] 4.45 0. 843 
proposed 4.45 0. 843 


(a)m-15, £=3.80 (b)m-18, £=2.83 (c)m-22, £7.01 (d)m-27, £-3.70 


图 2.3 MC 优化 算法 在 数据 集 Chromosome( 左 ) 和 Semicircle( 右 ) 上 的 多 边 形 近似 结果 


从 中 我 们 可 以 看 到 ,对 于 两 类 多 边 形 近似 问题 ,我 们 的 算法 获得 了 最 优 或 接 
近 最 优 的 方案 , 且 相 比 其 他 三 种 近似 算法 ,我 们 的 算法 有 更 好 的 近似 精度 代价 
比 。 原 因 可 以 解释 为 : 

首先 ,近似 算法 中 和 0 都 基于 遗传 算法 ,尽管 他 们 具有 全 局 优化 算法 的 特 
征 , 能 够 在 方案 空间 中 进行 全 局 搜索 ,但 它们 在 局 部 搜索 方面 缺乏 有 效 性 。 从 能 量 
空间 的 角度 分 析 , 当 多 边 形 近 似 问题 的 能 量 分 布 崎 蝶 不 平时 ,搜索 往往 易于 陷入 局 
部 能 量 极 小 点 。 遗 传 算法 通常 需要 大 量 的 个 体 (迭代 ) 来 实现 在 方案 空间 的 全 局 搜 
索 , 因 而 当 种 群 大 小 和 代 的 数目 较 小 时 ,很 难 靠 近 或 获得 全 局 最 佳 方案 。 我 们 的 方 
法 尽管 使 用 较 低 的 计算 代价 ,但 是 通过 基于 分 裂 或 合并 操作 的 局 部 优化 , MC 采样 
在 变换 后 的 较为 平坦 的 能 量 空间 上 进行 采样 ,因而 能 够 有 效 地 避免 采样 陷入 局 部 
模式 。 此 外 ,通过 局 部 优化 过 程 ,提高 了 整体 采样 的 效率 ,使 得 采样 算法 在 较 小 的 
迭代 次 数 内 访问 到 不 同 的 局 部 模式 ,增加 了 达到 或 靠近 全 局 最 佳 方案 的 机 会 。 

其 次 ,对 于 控制 点 检测 算法 [L133], 尽 管 它 能 够 通过 曲线 的 局 部 特征 (例如 曲 
率 ) 分 析 进 行 近似 方案 的 局 部 搜索 ,具有 很 高 的 局 部 搜索 性 能 ,然而 基于 局 部 搜索 
的 近似 算法 往往 对 初始 方案 点 的 选择 较为 敏感 ,并 且 它 没有 有 效 的 机 制 处 理 搜索 
过 程 中 经 常 出 现 的 局 部 模式 陷入 问题 (Local-Trap Problem)。 因 而 它 不 易于 获得 
多 边 形 近似 问题 的 全 局 最 佳 方案 ,尤其 是 当 轮廓 曲线 的 数据 点 非常 庞大 的 情况 下 。 
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我 们 的 算法 ,本质 上 属于 一 类 Basin-Hopping 蒙特 卡 洛 采样 方法 , 它 除 了 具有 局 部 
优化 能 力 , 还 可 通过 MC 全 局 采样 指导 优化 过 程 ,避免 优化 陷入 局 部 能 量 极 小 点 。 


@ 2.6 小 HS 


本 章 介绍 了 MCMC 采样 方法 的 基本 概念 、 理 论 和 算法 实现 ;讨论 了 MCMC $E 
法 的 实施 和 性 能 评估 方法 。 研 究 了 传统 的 MCMC 采样 算法 在 高 维 状 态 空间 中 采 
样 时 表现 出 混合 性 较 差 且 易于 陷入 局 部 模式 的 基本 原因 。 介 绍 了 自 适应 MCMC 
采样 方法 的 基本 概念 、 理 论 和 算法 实现 ,分 析 了 当前 主流 的 三 类 Adaptive MCMC 
算法 ( 即 再 生 马 氏 链 ,提议 分 布 自 适应 和 目标 分 布 自 适 应 ) 的 采样 机 制 和 内 在 关联 。 
探讨 了 MCMC 采样 算法 在 计算 机 视觉 中 的 应 用 ,提出 了 一 种 结合 局 部 优化 与 全 局 
MC 采样 的 目标 轮廓 近似 表示 算法 。 实 验 表明 ,基于 分 裂 - 合 并 的 局 部 优化 技术 与 
基于 采样 的 全 局 优化 相 结 合 能 够 有 效 地 解决 两 类 多 边 形 近 似 问题 。 与 同类 的 主流 
算法 相 比 ,我 们 提出 的 算法 具有 更 好 的 近似 精度 代价 比 。 对 于 更 为 复杂 的 多 边 形 
近似 问题 ,例如 ,大 规模 数据 点 的 轮廓 曲线 近似 等 问题 ,算法 还 需 结合 轮廓 曲线 自 
身 的 局 部 或 全 局 特征 信息 ,设计 更 为 有 效 地 提议 分 布 ,从 而 进一步 提高 算法 的 近似 
性 能 。 
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序 贯 随机 蜗 近 蒙特 卡 洛 跟踪 方法 


@ 3.1 5| ue 


作为 计算 机 视觉 领域 经 典 的 .核心 的 研究 内 容 之 一 ,视觉 跟踪 技术 融合 了 图 像 
处 理 与 理解 、 模 式 识别 .机 器 学 习 以 及 计算 机 软 硬 件 等 众多 学 科 领 域 的 方法 与 技 
术 。 计 算 机 视觉 研究 具有 较 高 的 科学 价值 和 广阔 的 应 用 前 景 ,而 视觉 跟踪 是 计算 
机 视觉 研究 领域 的 基础 和 关键 环节 之 一 ,是 该 领域 中 更 高 层次 (如 行为 分 析 、 理 解 
等 ) 研 究 的 基础 。 

动态 场景 中 的 视觉 跟踪 可 看 作 可 视 目 标 在 视频 的 相继 帧 之 间 建 立 一 种 对 应 关 
系 , 它 是 计算 机 视觉 研究 领域 的 一 项 重要 研究 课题 ,是 视频 分 析 , 行 为 识别 和 运动 
分 析 的 基础 和 关键 环节 ,在 众多 学 科 和 领域 有 着 广泛 的 应 用 。 

作为 计算 机 视觉 研究 中 的 一 个 热点 研究 方向 ,视觉 跟踪 在 近年 来 得 到 了 高 度 
的 关注 和 广泛 的 研究 。 从 方法 论 的 角度 ,视觉 跟踪 的 研究 方法 可 归结 为 自 底 向 上 
和 自 项 向 下 的 两 种 思路 。 自 底 向 上 的 方法 更 多 依赖 于 可 靠 的 检测 技术 ,直接 从 视 
觉 场 景 中 获取 目标 的 相关 信息 并 用 于 视觉 跟踪 。 自 项 向 下 的 方法 也 称 为 模型 驱动 
的 方法 ,最 典型 的 例子 是 线性 或 非 线 性 的 状态 空间 模型 的 方法 。 对 应 于 自 底 向 上 
和 自 项 向 下 的 两 种 研究 思路 ,当前 的 视觉 跟踪 算法 大 抵 可 以 分 为 两 大 类 :确定 性 跟 
踪 方 法 和 随机 跟踪 方法 [2] 。 

确定 性 跟踪 方法 一 般 利用 自 底 向 上 的 底层 视觉 信息 提供 可 靠 的 检测 结果 实现 
快速 的 目标 跟踪 。 这 些 自 底 向 上 的 视觉 信息 包括 第 1 章 介绍 的 目标 特征 信息 , 包 
括 Haar— like 特征 .颜色 直方 图 .梯度 方向 直方 图 (CHOG)、 边 缘 方向 直方 图 
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(EOG) 尺度 不 变 的 特征 变换 (SIFT) 等 。 尽 管 基于 Mean Shift 的 确定 性 跟踪 方法 
取得 了 很 大 的 成 功 ,但 是 这 种 方法 通常 要 求 在 相继 的 两 帧 之 间 目 标的 位 移 较 小 。 
其 主要 原因 在 于 Mean Shift 算法 容易 受到 多 模 场 景 中 背景 噪声 等 因素 干扰 而 陷入 
局 部 最 优 状 态 , 从 而 导致 跟踪 失败 。 对 于 运动 不 确定 性 的 目标 跟踪 问题 ,确定 性 的 
跟踪 方法 容易 跟踪 失败 并 且 很 难 从 错误 状态 中 恢复 。 尽 管 结合 随机 采样 或 模拟 退 
火 过 程 的 Mean Shift 算法 能 够 在 一 定 程度 上 提高 跟踪 的 稳健 性 ,但 在 处 理 复杂 多 
模 分 布 的 问题 时 仍然 难以 取得 令 人 满意 的 跟踪 性 能 。 

不 同 于 确定 性 的 跟踪 方法 ,基于 随机 采样 的 概率 跟踪 方法 能 有 效 地 实现 在 多 
模 分 布 场景 下 的 视觉 跟踪 任务 。 这 类 方法 通常 是 在 基于 贝 叶 斯 跟踪 框架 下 ,通过 
状态 预测 与 观测 似 然 迭 代 地 估计 后 验 分 布 实现 对 目标 状态 的 估计 。 在 运动 模型 与 
观测 度量 呈 线 性 ,噪声 服从 高 斯 分 布 的 情况 下 ,卡尔 曼 滤 波 59 可 以 获得 贝 叶 斯 滤 
波 的 精确 解析 解 。 对 于 非 高 斯 条 件 下 的 非 线性 系统 ,通常 是 使 用 MC 模拟 技术 来 
实现 迭代 的 贝 叶 斯 滤波 。 序 贯 MC 算法 或 粒子 滤波 外 是 此 类 跟踪 方法 的 典型 代 
表 。 一 般 情况 下 ,使 用 大 量 的 粒子 能 够 很 好 地 近似 复杂 的 滤波 分 布 , 但 是 高 昂 的 计 
算 代价 往往 使 得 跟踪 算法 不 能 满足 实际 的 跟踪 需要 。 

本 章 探 讨 在 贝 叶 斯 滤波 框架 下 的 视觉 跟踪 方法 。 通 过 引入 一 种 高 效 的 自 适应 
MCMC 采样 方法 到 贝 叶 斯 滤波 框架 ,提出 一 种 新 的 概率 跟踪 算法 , 即 序 贯 随机 世 
近 蒙 特 卡 洛 (Sequential SAMC,S-SAMC) 跟 踪 算 法 , 它 能 对 复杂 多 模 的 滤波 分 布 
进行 有 效 地 采样 。 同 时 , 它 是 一 个 通用 的 跟踪 框架 ,易于 集成 各 种 有 效 的 观测 模型 
和 先 验 模型 以 进一步 提高 跟踪 算法 的 稳健 性 。 


@ 3.2 相关 工作 @ 


在 基于 随机 采样 的 视觉 跟踪 方法 中 ,粒子 滤波 是 最 为 成 功 的 一 个 跟踪 框架 ， 
它 具 有 很 好 的 可 扩展 性 。 一 般 来 说 ,直接 从 后 验 (滤波 ) 分 布 采样 是 比较 困难 的 。 
在 状态 空间 中 有 效 的 采样 策略 对 于 粒子 滤波 算法 来 说 至 关 重 要 。 从 采样 的 角度 
看 ,粒子 滤波 算法 可 以 归 为 三 类 , 即 重要 性 采样 "中 ,因子 采样 外 ,以 及 拒绝 采 
样 " 习 等。 重要 性 采样 的 基本 出 发 点 在 于 尽 可 能 从 样本 空间 中 靠近 后 验 模式 的 
区 域 采 样 。 对 于 贝 叶 斯 滤波 问题 ,重要 性 采样 的 关键 在 于 如 何 选取 提议 分 布 。 
序 贯 重要 性 采样 (SIS) 是 最 为 常用 的 一 种 解决 贝 叶 斯 滤波 问题 的 算法 , 它 通 过 先 
前 时 间 阶 估计 得 到 的 后 验 密度 迭代 产生 提议 分 布 。 序 贯 重要 性 采样 算法 的 缺点 
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在 于 粒子 退化 问题 中 ,也 就 是 说 ,一 旦 提议 分 布 与 实际 滤波 分 布 的 形状 匹配 不 
佳 ,大 部 分 粒子 的 权重 将 变 得 很 小 ,这 些 粒 子 在 传播 过 程 中 其 影响 将 逐渐 趋 于 
零 , 这 将 导致 大 量 的 计算 代价 浪费 在 低 权 重 的 粒子 上 。 男 一 方面 ,因子 采样 算法 
的 缺陷 在 于 样本 贫 化 现象 , 即 多 个 样本 落 在 样本 空间 中 的 同一 点 ,导致 样本 集 缺 
乏 多 样 性 。 
通过 在 状态 空间 中 维持 多 个 假设 ,粒子 滤波 算法 能 够 比较 有 效 地 处 理 多 模 分 
布 问题 。 作 为 一 个 一 般 性 的 通用 跟踪 框架 ,尽管 它 在 视觉 跟踪 领域 取得 了 很 大 成 
功 ,但 是 粒子 滤波 算法 本 身 在 处 理 高 维 状 态 空 间 的 跟踪 问题 时 仍然 具有 局 限 性 。 
为 了 克服 这 一 局 限 性 ,一 些 研究 人 员 尝 试 通过 多 种 途径 来 进一步 改进 粒子 采样 效 
率 。 近 年 来 ,将 密度 估计 方法 引入 到 粒子 滤波 框架 成 为 了 提高 粒子 采样 效率 的 有 
Aliis 162 — 0579, Cham 和 Rehgc9 使 用 一 个 分 片 的 高 斯 模型 来 表示 观测 似 然 度 
量 和 先 验 预 测 密度 ,从 而 获得 后 验 密度 的 解析 计算 方式 ,实现 多 假设 跟踪 。Ver- 
maak 等 人 中 则 直接 将 后 验 密 度 建 模 为 高 斯 混合 模型 ,作者 指出 后 验 密度 的 传播 
可 以 通过 对 混合 模型 的 单个 成 分 独立 地 进行 滤波 ,每 个 成 分 都 获得 一 定数 目的 粒 
子 , 以 此 实现 多 假设 跟踪 。Han 等 人 "将 核 密度 估计 技术 引入 到 序 贯 贝 叶 斯 滤波 
框架 实现 快速 的 后 验 密度 解析 和 估计 。 此 外 ,密度 估计 的 支持 向 量 方法 也 在 序 贯 
贝 叶 斯 滤波 中 得 到 了 应 用 5 Baner jee 和 BurlinaP? R FH fit bhi Ez 9 BE fh 3E AY 77 3: 
计算 给 定 粒子 集 的 先 验 密度 ,其 中 的 密度 估计 器 包括 支持 向 量 描述 (SVDD) 和 相 
关 向 量 机 (RVMD)55 。 在 粒子 滤波 框架 中 采用 支持 向 量 的 方法 估计 密度 ,其 目的 是 
获得 后 验 密 度 的 稀疏 表示 和 人 解析 解 , 从 而 降低 粒子 滤波 的 计算 代价 。 
基于 密度 估计 的 技术 应 用 在 贝 叶 斯 滤波 有 助 于 简化 采样 问题 ,同时 在 采样 过 
程 中 也 可 以 维持 多 个 假设 ,但 是 粒子 滤波 算法 仍然 受 限于 高 昂 的 计算 代价 ,尤其 是 
在 复杂 滤波 分 布 条 件 下 需要 使 用 大 量 的 粒子 来 近似 后 验 分 布 。 为 了 降低 计算 负担 
提高 粒子 采样 效率 ,学 者 们 提出 了 多 种 粒子 滤波 改进 算法 。Deutcher 等 人 [中 在 传 
统 的 粒子 滤波 跟踪 算法 外 中 交错 地 使 用 一 个 模拟 退火 过 程 。 模 拟 退 火 过 程 便于 从 
平滑 化 的 后 验 分 布 采样 ,这 种 结合 使 得 抽取 的 样本 靠近 实际 的 后 验 模式 ,从 而 避免 
采样 陷入 局 部 最 优 模式 。 该 方法 的 一 个 局 限 性 是 由 于 在 采样 中 调用 模拟 退火 算 
法 ,缓慢 的 退火 过 程 使 得 滤波 算法 的 计算 复杂 度 仍然 很 高 。Choo 和 Fleet? 提出 
在 序 贯 贝 叶 斯 框架 下 使 用 MCMC 采样 方法 替代 广泛 采用 的 重要 性 采样 算法 ,直接 
从 后 验 分 布 采样 。 这 种 采样 方式 主要 是 通过 一 个 合适 的 提议 分 布 从 后 验 分 布 中 采 
样 ,以 此 构建 一 条 收敛 于 后 验 分 布 的 马 氏 链 。 相 比 与 传统 的 序 贯 重要 性 采样 算 
法 ,使 用 MCMC 采样 的 好 处 在 于 可 以 更 高 效 地 从 后 验 分 布 中 采样 ,因而 可 以 使 
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用 较 少 的 粒子 来 近似 目标 分 布 。 与 此 工作 类 似 ,Khan 等 人 器 提 出 一 种 基于 MC- 
MC 采样 的 粒子 滤波 算法 用 于 多 目标 跟踪 。 作 者 直接 在 高 维 的 状态 空间 中 建 模 
多 目标 状态 ,通过 引入 一 个 基于 马尔 科 夫 场 的 运动 先 验 来 描述 多 目标 跟踪 场景 
下 目标 间 的 相互 影响 ,实现 在 高 维 状 态 空间 中 的 MCMC 采样 。 他 们 的 实验 表 
明 , 相 比 于 独立 的 多 个 粒子 滤波 实现 ,使 用 MCMC 采样 替代 序 贯 重要 性 采样 可 
以 显著 地 减少 所 需 的 粒子 数目 从 而 降低 计算 复杂 度 。 紧 接着 ,Zhao 等 人 中 提出 
采用 数据 驱动 的 MCMC 采样 思路 替代 传统 的 MCMC 方法 ,在 采样 过 程 中 更 有 
效 地 估计 提议 分 布 ,使 产生 的 样本 更 靠近 样本 空间 中 的 局 部 模式 ,从 而 提高 采样 
效率 、 降 低 计算 复杂 度 。 

尽管 SMC 采样 方法 和 多 种 MCMC 采样 方法 在 贝 叶 斯 滤波 跟踪 问题 中 表现 出 
良好 的 可 扩展 性 ,但 是 对 于 复杂 多 模 的 滤波 分 布 , 现 有 的 随机 跟踪 方法 在 采样 效率 
方面 还 有 待 进一步 提高 。 探 索 更 为 高 效 的 贝 叶 斯 滤波 跟踪 方法 仍然 是 个 极 具 挑 战 
性 的 研究 课题 。 


€ 3.3 方法 介绍 @ 


3.3.1 贝 叶 斯 滤波 


在 贝 叶 斯 滤波 跟踪 框架 下 ,视觉 跟踪 可 看 作 状 态 空间 模型 中 系统 的 状态 估计 
问题 。 在 此 框架 下 ,目标 的 状态 是 一 个 随机 变量 ,目标 跟踪 的 任务 是 基于 系统 的 动 
态 模型 ,从 噪声 观测 数据 中 估计 后 验 概率 (滤波 ) 密 度 。 系 统 定义 为 

Ze = fGu su) 
(3.1) 
za 4 
式 中 ,zx,€ R" 表示 目 标 在 : 时 刻 的 状态 ,是 要 求解 的 状态 变量 ;函数 f 为 系统 的 动 
态 模 型 ,定义 了 系统 状态 随时 间 的 演化 规律 , 它 通常 定义 为 一 阶 马尔 科 夫 模型 ;u 
表示 系统 噪声 影响 ;x,€ R” 表示 系统 的 图 像 观 测 ;函数 为 系统 的 观测 模型 ,描述 
了 目标 状态 与 图 像 观 测 的 关联 ;vw 为 观测 噪声 。 

在 贝 叶 斯 滤波 框架 下 ,系统 的 动态 模型 和 观测 模型 可 以 分 别 用 概率 分 布 p Cr, 
|z-1) 和 plz,|xi) 来 表示 。 按 照 贝 叶 斯 律 ,可 以 在 各 个 时 刻 1 序 贯 地 估计 目标 状态 
zt 的 后 验 密 度 p Cx, lz). K 3-1 所 示 为 状态 与 观测 在 图 模型 (Graphical Model) 
下 的 表示 。 
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xf Ga) 


图 3-1 状态 与 观测 在 图 模型 下 的 表示 


记 zie = {zn ote ott ze} Aus E ARTA c 的 观测 集 , 贝 叶 斯 滤波 的 实现 依 
赖 于 两 个 迭代 进行 的 阶段 , 即 预测 和 更 新 。 


预测 : Pla, | za) = [oc | xa) Goa | 211) dr (3.2) 


更 新 : PG | Zie © 5G, | x20 pCa | zu) (3.3) 

预测 阶段 使 用 传播 密度 p(x |x,-1) 计 算 先 验 分 布 ,而 更 新 阶段 使 用 观测 度量 
p(zi|xi) 更 新 后 验 。 当 噪声 为 高 斯 分 布 且 系统 的 演化 和 度量 均 为 线性 时 ,卡尔 曼 
滤波 可 以 获得 精确 式 (3. 1) 的 解析 解 。 然 而 在 实际 应 用 中 ,系统 多 为 非 高 斯 条 件 下 
的 非 线性 系统 。 在 这 种 情况 下 ,以 高 斯 噪声 作为 基本 假设 的 卡尔 曼 滤波 ,扩展 的 卡 
尔 曼 滤 波 (EKF), 以 及 Unscented 卡尔 曼 滤 波 (UKF) 均 无 法 很 好 地 解决 贝 叶 斯 滤 
波 问题 。 


3.3.2 TEE 


粒子 滤波 以 7 ,又 称 序 贯 蒙特 卡 洛 方法 ,是 实现 贝 叶 斯 滤波 的 一 种 MC 采样 技 
术 。 它 在 每 个 时 间 阶 1 使 用 一 个 加 权 的 粒子 集 {zf? eof? }) 袜 ;来 近似 后 验 密度 。 各 
个 时 间 阶 的 粒子 集 通过 系统 的 动态 模型 传播 到 下 一 个 时 间 阶 。 通 过 这 些 粒子 和 权 
重 ,可 以 获得 目标 状态 的 估计 值 。 粒 子 滤波 的 实现 有 多 种 版 本 ,从 采样 的 角度 看 粒 
子 滤 波 算法 可 以 归 为 三 类 , 即 重要 性 采样 ,因子 采样 以 及 拒绝 采样 。 这 里 我 们 仅 描 
述 最 为 一 般 的 算法 实现 , 它 包 含 了 不 同 版 本 的 粒子 滤波 算法 的 主要 特征 ,容易 推导 
RE 

算法 输入 CRIT E Ge, we? S SOME z; 

算法 输出 :: 时 刻 粒 子 集 {z2 "o 状态 估计 ass 

(1) 从 提议 分 布 中 抽取 样本 : 

2? —qG|zax,.,2),1-—1,2,7.,N 


53 


| ) 视觉 跟踪 中 的 马 氏 链 蒙特 卡 洛 方法 


(2) 粒子 加 权 : 
wf? oc wi, pe 一 EO. ded oes 
(3) 归 一 化 权重 : 
wf? = aa i= ha N 
Dw? 


(4) 计算 粒子 集 的 有 效 样本 量 Ness : 


N 
Ness = >) Go? 
i=1 
(5) If Na 二 No then // 重 采样 
- 估计 累积 分 布 f: 


i-l 
= Df, tw i —1,2,,N 
j=l 
- For i=1 to N 


= u;~Unif C0, fa) 
= R biGQu — fi) Gu — fai) KO 


= 7 =r” pw E 
— End For 
End If 
(6) 状态 估计 : 
= Mera 


RADIIS RET MERERI OR SMC 算法 5 。 如 果 不 考虑 重 采 
样 步骤 (5) ,算法 等 价 于 序 贯 重要 性 采样 (SIS) 算 法 ;如 果 重 采样 步骤 (5) 不 依赖 于 
有 效 样本 大 小 Ness 且 总 是 包含 在 算法 中 ,那么 该 算法 就 等 价 于 著名 的 Consenda- 
tion 算法 外 ,或 者 采样 重要 性 重 采样 (SIR) 算 法 。 类 似 地 ,如 果 密 度 传播 不 考虑 当 
前 的 观测 度量 , 即 p Cr, l| xi 2 = p Geil x0 BARE ffr F Bootstrap 粒子 滤 
HO, XCTORBUEACKU Ness 的 讨论 ,参见 本 书 第 2 章 的 重要 性 采样 部 分 。 

如 图 3-2 所 示 ,我 们 以 经 典 的 STR 算法 为 例 , 分 析 粒 子 滤波 算法 的 一 个 迭代 过 
RO, AFETE /一 1 时 刻 的 等 权重 粒子 集 { f ud 它 用 于 近似 分 布 p(x | 


Zee)» YE L— 1 时 刻 ,使 用 观测 度量 对 粒子 进行 加 权 {Z2i ,we }>=i, 它 用 于 近似 
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1—1 时 刻 的 后 验 分 布 p(zr-i| sw-i)。 然 后 ,执行 重 采样 步骤 获得 等 权重 粒子 集 
(«t p], INR de HR d e p(x la. HUE ECT SI 
议 分 布 (重要 性 函数 ) 传 播 到 à 时 刻 生成 { zio wy} ABLE MS i pCa zai. 
至 此 ,完成 了 算法 从 :一 1 时 刻 到 * AREER, 


H 
| 
i 
Y 
e {x , wY} 


iv 
oo 


图 3-2 FERE SEE CREE CSIRO PEM — KER. 
在 不 同 版 本 的 粒子 滤波 实现 中 ,Bootstrap 粒子 滤波 5 是 较为 吸引 人 的 一 种 算 
法 。 它 直接 使 用 先 验 分 布 ( 动 态 模型 ) 作 为 提议 分 布 , 从 而 将 粒子 加 权 步 又 (2) 简 
化 为 


wf? oc wf pG, | zi?),i = 1,2,°°,N (3. 4) 
这 意味 着 粒子 权重 的 更 新 只 依赖 于 当前 的 观测 密度 p Cz lax) ,使 得 采样 和 计算 过 
程 更 为 简化 和 直观 。 尽 管 采 用 先 验 密度 作为 提议 分 布 能 够 给 滤波 计算 带 来 简化 ， 
但 是 也 容易 导致 滤波 采样 性 能 的 下 降 。 其 主要 原因 在 于 从 观察 序列 中 获取 的 信息 
往往 带 有 噪声 ,缺乏 稳健 性 ,尤其 是 当先 验 分 布 与 基于 当前 观测 的 后 验 分 布 之 间 匹 
配 不 佳 (支撑 区 域 的 交集 较 小 ) 时 。 一 种 可 行 的 方案 是 在 提议 分 布 中 既 考 虑 粒子 的 
历史 状态 也 兼顾 当前 的 观测 信息 25 ,例如 ,使 用 如 下 的 提议 分 布 : 


pla, | xa ple | x) (3.5) 


qG, | Lea +k) 
[oc | te) plz, | 3)dx 
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这 就 是 所 谓 的 “最 优 ”提议 分 布 % 针 。 其 主要 特征 是 ,给 定 粒子 的 历史 轨迹 ,粒子 权 
重 的 条 件 方差 为 零 。 基 于 这 一 提议 分 布 , 粒 子 加 权 按 下 式 进行 : 


wP oc wf? plz, | ta) = ut [p | x&) p, | xDdx (3.6) 


“最 优 ”提议 分 布 产生 的 粒子 倾向 于 聚集 在 条 件 后 验 密度 很 高 的 区 域 ,不 同 于 
采用 动态 模型 作为 提议 分 布 时 在 状态 空间 中 盲目 地 产生 粒子 。 尽 管 这 种 提议 分 布 
在 理论 上 具有 优良 的 性 质 ,但 式 (3. 6) 中 的 积分 项 在 多 数 情况 下 无 解析 形式 ,因而 
需要 采用 一 些 近似 技术 来 计算 ,包括 使 用 非 线性 滤波 的 局 部 线性 化 、 高 斯 近似 等 
men, 


3.3.3 基于 MCMC RH HH T dE 


尽管 粒子 滤波 由 于 其 良好 的 可 扩展 性 在 视觉 跟踪 领域 得 到 了 广泛 的 应 用 ,但 
是 算法 实现 仍然 受 限 于 高 昂 的 计算 代价 ,尤其 是 在 复杂 滤波 分 布 条 件 下 需要 大 量 
的 粒子 来 近似 后 验 分 布 。Choo 和 Fleet?" 提出 在 序 贯 贝 叶 斯 框架 下 使 用 MCMC 
采样 方法 替代 广泛 采用 的 重要 性 采样 算法 ,直接 从 后 验 分 布 采样 。 这 种 采样 方式 
主要 是 通过 一 个 合适 的 提议 分 布 从 后 验 分 布 中 采样 ,以 此 构建 一 条 收敛 于 后 验 分 
布 的 马 氏 链 。 相 比 传统 的 序 贯 重 要 性 采样 算法 ,使 用 MCMC 采样 的 好 处 在 于 可 以 
更 高 效 地 从 后 验 分 布 中 采样 ,因而 可 以 使 用 较 少 的 粒子 来 近似 目标 分 布 。 与 此 工 
作 类 似 ,Khan 等 人 加 提出 一 种 基于 MCMC 采样 的 粒子 滤波 算法 用 于 多 目标 跟踪 。 
这 些 研究 工作 表明 ,使 用 MCMC 采样 替代 序 贯 重要 性 采样 可 以 显著 地 减少 所 需 的 
粒子 数目 ,从 而 降低 计算 复杂 度 。 

基于 MCMC 采样 的 粒子 滤波 算法 (MCMC-PF) 使 用 Metropolis-Hastings 算 
法 构建 一 条 收敛 于 贝 叶 斯 滤波 分 布 的 马 氏 链 。 假 定 上 一 1 时 刻 获得 的 粒子 集 为 
(£21 wis ya BRA p(x |zis,) 可 以 近似 地 表示 为 


Pare | zia) © ple | x0 X wË, pla, | x9) (3.7) 
假定 提议 分 布 为 gq, 在 第 i 次 迭代 链 的 状态 为 x  MCMC-PF 使 用 提议 分 布 g 产生 


一 个 候选 样本 zx ,并 以 概率 aa}? x: 
] bG' | ziadal 32’) | 


"p? | z,0qG' 32) CSES) 


接受 z 为 马 氏 链 的 新 样本 ,和 否则 保留 xz 。 
值得 注意 的 是 ,MCMC-PF 使 用 Metropolis-Hastings 算法 直接 从 后 验 分 布 中 


AT : 
ax x^) min 
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采样 ,因而 构建 的 马 氏 链 以 滤波 分 布 为 极限 平稳 分 布 , 这 意味 着 获得 的 样本 集 是 等 
权重 或 无 权重 的 (Unweighted) ,这 与 重要 性 采样 有 着 本 质 的 不 同 。 于 是 式 (3.7) 
可 以 改写 为 


N 
pla, | m) © ple, | x20 pCa | a9) (3.9) 
i=l 


采样 过 程 结 束 后 ,对 状态 变量 的 估计 可 通过 马 氏 链 上 的 样本 点 采用 MSE 准则 
或 MAP 准则 进行 。 状 态 的 MAP 估计 为 
MAP = argman, p Gr, | zi 2 «x, € (ai? ne (3.10) 
如 果 状 态 估 计 采 用 MSE 准则 ,一 般 需要 对 马 氏 链 上 一 定数 量 的 初期 样本 做 丢弃 处 
理 (Burn-In), 以 降低 估计 误差 。 关于 马 氏 链 的 收敛 诊断 与 分 析 详 见 本 书 的 第 
2 章 。 
MCMC-PF 算法 描述 如 下 : 
算法 输入 : BPH ON. 观测 s 
算法 输出 : BEAR af? ML, RAS THEE oi? 
CD. MATFRE (x a BE LAT RE AS af ; 
(2) 产生 初始 样本 xi? ~ pCa, x05 
(3) For i=1 to N 
— 抽取 候选 样本 qt gal?) 
- 按照 式 (3. 8) 计 算 接受 比 a; 
-以 概率 a 接受 zx ,并 令 a? =2's 否则 令 rau; 
End For 
(4) 按照 式 (3. 10) 估 计 MAP, 
MCMC-PF 算法 尽管 能 够 在 一 定 程度 上 克服 粒子 滤波 算法 在 采样 过 程 中 存在 
的 粒子 贫 化 现象 ,但 是 传统 的 MCMC 算法 ,例如 Metropolis-Hastings 算法 ,在 对 
复杂 多 模 的 滤波 分 布 进行 采样 时 往往 表现 出 混合 性 差 ,收敛 缓慢 等 特点 ,使 得 采样 
可 能 长 时 间 停 留 在 某 个 状态 无 法 从 局 部 模式 中 跳出 。 此 外 , MCMC-PF 算法 中 使 
用 的 提议 分 布 一 般 采 用 局 部 高 斯 扰动 ,因而 构建 的 马 氏 链 事实 上 是 一 条 随机 游 走 
链 。 提 议 分 布 延 展 度 的 设置 往往 很 难 把 握 ,过 大 或 过 小 的 方差 都 可 能 造成 采样 性 
能 的 下 降 。 这 些 局 限 性 使 得 MCMC-PF 算法 在 处 理 具 有 复杂 多 模 分 布 的 视觉 跟踪 
问题 时 ,往往 容易 导致 目标 跟踪 的 失败 。 


3.3.4 序 贯 随机 逼近 蒙特 卡 洛 跟踪 方法 


通过 将 随机 台 近 蒙特 卡 洛 (SAMC) 采 样 方法 9 引入 到 贝 叶 斯 滤波 跟踪 框架 
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中 ,本 章 提出 一 种 序 贯 随机 台 近 蒙特 卡 洛 (Sequential SAMC) 跟 踪 方 法 。 它 能 显著 
地 提高 MCMC 算法 对 滤波 分 布 的 采样 效率 ,同时 能 够 有 效 地 避免 MCMC 采样 陷 
入 局 部 模式 。 本 节 首 先 分 析 MCMC 算法 应 用 于 滤波 分 布 采样 时 易于 陷入 局 部 模 
式 的 原因 ,然后 给 出 我 们 的 解决 方案 ,最 后 介绍 Sequential SAMC 跟踪 算法 的 实现 
细节 。 

正如 MCMC-PF 算法 所 介绍 的 ,MCMC 方法 可 替代 常用 的 SIR 算法 对 滤波 
分 布 进行 采样 ,以 获得 更 为 理想 的 近似 。 给 定 目 标 分 布 ( 即 滤波 分 布 )p(z|zi,,) 和 
当前 链 的 状态 x, ,一 个 Metropolis-Hastings 采样 步骤 包括 :使 用 提议 分 布 gC， ix) 
抽取 一 个 候选 样本 zx', 马 氏 链 以 概率 a(x ;zx,) 从 状态 x, 跳跃 到 xz ,其 中 


plx | zidal tesa | (3; 11) 


"pla, | ziqG iz) 
从 式 (3.11) 可 以 看 到 ,如 果 链 的 当前 状态 处 于 滤波 分 布 的 峰值 附近 ,或 提议 的 样本 
处 于 滤波 分 布 的 尾部 ,那么 采样 过 程 就 可 能 陷 人 局 部 模式 ,很 难 从 中 逃离 并 跳跃 到 
别 的 模式 。 对 于 复杂 多 模 的 滤波 分 布 ( 例 如 ,场景 中 存在 多 个 相似 的 运动 目标 ,或 
目标 运动 具有 极 大 不 确定 性 等 因素 ) 来 说 ,其 能 量 分 布 往往 表现 出 崎 岂 不 平 的 特 
征 ,MCMC 采样 能 否 有 效 地 跨越 高 能 量 屏障 到 达 样 本 空间 的 其 他 模式 ,决定 了 滤 
波 跟踪 的 输出 性 能 。 从 能 量 空间 的 角度 看 ,如 果 采 样 算 法 能 够 在 滤波 分 布 的 各 个 
能 量 阶 子 区 域 进行 随机 游 走 ,那么 就 可 以 从 本 质 上 有 效 地 避免 采样 陷入 局 部 模式 。 

记 革 为 滤波 分 布 p(xz,|zi,) 的 样本 空间 。 首 先 按照 能 量 阶 (Level) 把 样本 空间 
A Xl JJ m 个 不 相交 的 子 区 域 (Subregion) . Hl =U Y;.i—1.2.*.m. TEX. 
按照 实 值 能 量 函 数 E(z,) 二 一 log{p(zi|xzi,,)} 把 样本 空间 计划 分 为 m 个 等 能 量 带 
(Energy Band): 


a(x';m)— min[1 


Xi1= {zx:E(x)<u} 
Xs={r:u<E(r)<u,} 


MX m1 = {runs EGO&us-i] 
An (xiEG2)Du-1) 
SUE eus us tuu md 个 实数 。 
接着 ,我 们 构造 一 个 试验 分 布 : 


dtes $a ee Ln), € xo (3.12) 
i=1 i 


其 中 ,1 为 示 性 函数 : g, 一 | p Ce | zu dees EBLE m (gi 12000 om) RT 
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以 看 作 连 续 分 布 系统 下 的 态 密度 (DoS) 项 。 直 观 上 看 ,如 果 态 密度 g 在 采样 过 程 
中 能 够 被 准确 地 估计 ,那么 从 试验 分 布 ps (zx,) 抽 样 意味 着 马 氏 链 将 会 在 能 量 空 间 
进行 随机 游 走 ,从 而 采样 的 局 部 陷入 问题 将 会 得 到 有 效 地 解决 。 
构造 试验 分 布 式 (3. 12) 替 代 原 始 的 滤波 分 布 作为 目标 分 布 并 从 中 采样 ,其 用 
意 就 是 在 于 通过 MCMC 采样 自 适应 地 估计 目标 分 布 ,通过 对 态 密度 项 的 估计 来 间 
接地 抽取 服从 滤波 分 布 的 (加 权 ) 样 本 。 这 种 采样 思路 在 一 定 程 度 上 是 受到 Multi- 
canonical 系统 采样 算法 及 其 变 体 "" 的 启发 。 正 如 本 书 第 2 章 所 介绍 的 , Multi- 
canonical 采样 算法 及 其 多 种 变 体 在 物理 学 领域 应 用 广泛 ,通常 用 于 对 一 些 物理 量 
的 估计 和 计算 , 它 能 够 有 效 地 避免 在 采样 过 程 中 陷入 局 部 能 量 极 小 点 。 这 些 采样 
算法 大 多 面向 全 局 优化 ,或 统计 量 估计 。 然 而 ,对 于 贝 叶 斯 滤波 跟踪 问题 ,我 们 既 
要 考虑 如 何 避 免 采样 陷入 局 部 模式 ,还 需要 考虑 粒子 传播 ,粒子 加 权 等 问题 。 接 下 
来 我 们 详细 闻 述 如 何 将 随机 交 近 蒙特 卡 洛 采样 方法 引入 到 贝 叶 斯 滤波 框架 ,提出 
一 种 序 贯 随机 允 近 蒙特 卡 洛 跟踪 方法 ,实现 更 为 高 效 稳 健 的 视觉 跟踪 。 
l. 随机 到 近 蒙 特 卡 洛 采 样 
随机 通 近 蒙特 卡 洛 (SAMC) 算 法 是 一 种 基于 目标 分 布 自 适应 的 MCMC 算法 ， 
同时 也 属于 Robbins-Monro555 类 型 的 随机 通 近 算法 。 它 通过 在 MCMC SES rdi 
A— BBL a VE iE BE CSAP) ,实现 对 目标 分 布 的 自 适应 更 新 与 估计 ,从 而 在 采样 过 
程 中 持续 地 改进 统计 量 ( 例 如 态 密度 ) 的 估计 精度 。 同 时 , 它 具 有 Multicanonical 
采样 算法 的 优点 ,能 够 有 效 地 避免 采样 陷入 局 部 模式 。 
假定 目标 分 布 为 贝 叶 斯 滤波 分 布 pCr lzi) o WK SAMC 采样 过 程 描述 如 下 : 
(1) Metropolis-Hastings 采样 
- 给 定 当前 链 上 的 样本 ai? ,使 用 提议 分 布 a(， sai? ) 抽取 一 个 候选 样 
本 x; 
一 计算 Metropolis-Hastings 接受 比 a: 
" p. qc? s x) 
balt qa’ 32”) 
- 以 概率 a HEE x 为 新 样本 a P = 2"; 
(2) 工作 权重 (working weight) 更 新 
gp = 0? + LIC? € X0-4$)i- p,2; G.10 
式 中 ,0 一 log gis$— (4; i—1.22 m) Pee et yes 
Y, 为 增益 因子 (Gain Factor) . CEBIT IAE. 在 Robbins-Monro 型 
的 随机 通 近 算法 中 ,要 求 增益 因子 满足 如 下 条 件 : 


e) 


(3. 13) 


ar sx min 
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lim, —0, 之 /为 一 co J<% (3.15) 
9 k=1 k=1 
式 中 ,7E 0.2), Æ SAMC 中 ,Liang ACUE F figs 2] 3; 
_ ko 
n= waak) Ca. 16) 


AIP ko cmo. ET. 

在 贝 叶 斯 滤波 中 ,在 任意 时 刻 :, 我 们 可 以 使 用 SAMC 算法 从 后 验 分 布 p(x| 
xi) 中 采样 ,在 获得 足够 数量 的 样本 集 后 再 对 x, 的 统计 量 进 行 估 计 。 对 应 于 贝 叶 
斯 滤波 跟踪 问题 ,就 是 通过 获取 的 样本 集 按照 MSE 准则 或 MAP 准则 对 目标 状态 
进行 估计 。 

值得 注意 的 是 ,在 贝 叶 斯 滤波 框架 下 ,对 后 验 分 布 的 估计 依赖 于 先前 时 刻 的 样 
本 历史 轨迹 ,因而 我 们 需要 考虑 粒子 的 随机 传播 .粒子 加 权 等 问题 。 接 下 来 我 们 详 
细 介 绍 如 何 使 用 SAMC 采样 方法 构建 一 个 动态 加 权 的 重要 性 采样 (Dynamical 
Weighted Importance Sampling, DWIS) 算 法 , 即 Sequential SAMC 算法 ,应 用 于 
贝 叶 斯 滤波 跟踪 。 

2. 序 贯 随机 逼近 蒙特 卡 洛 

与 基本 的 粒子 滤波 算法 和 MCMC-PF 算法 不 同 , 本 节 提 出 的 序 贯 随机 盘 近 蒙 
特 卡 洛 (Sequential SAMC，S-SAMC) 算 法 包含 三 个 主要 的 步骤 :条 件 密 度 传 播 、 
SAMC 采样 和 样本 加 权 (Reweighting)。 采 样 算法 流程 如 图 3-3 所 示 。 


SAMC 采 样 


图 3-3 S-SSAMC 采样 算法 流程 
CD 条 件 密度 传播 。 该 阶段 也 称 为 粒子 传播 ,其 目的 是 传播 前 一 时 间 阶 获得 的 
粒子 集 到 当前 时 间 阶 ,用 于 估计 当前 时 间 阶 的 后 验 密 度 。 给 定 前 一 时 间 阶 的 粒子 集 
(ai ,wR1) 福 1; 首先 计算 其 有 效 样本 大 小 Ness , 若 小 于 一 特定 的 阔 值 则 执行 一 次 重 
采样 操作 。 基 于 此 粒子 集 , 结 合 先 验 模 型 p(z,|z-i) 与 当前 时 间 阶 的 观测 度量 p 
Cz, | Xe) ,当前 时 间 阶 的 后 验 密度 (滤波 密度 )p(x|z1,.) 可 近似 为 


pCa, | zu © ple, | a) Pw pla, | 2). (3.17) 
此 外 ,鉴于 我 们 的 目的 是 构建 一 条 平稳 收敛 于 滤波 分 布 的 马 氏 链 , 因 而 需要 产 
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生 一 个 随机 初始 样本 zt。 初始 样本 的 产生 有 多 种 方式 。 一 种 典型 方式 是 从 
(x2, wi? IL, PH BC REA r2, ,然后 使 用 先 验 密度 传播 到 cl? 作为 初始 样本 。 
另 一 种 可 行 方案 是 使 用 先前 时 间 阶 的 目标 状态 MAP 估计 ,通过 二 阶 自 回归 模型 
(CAR2) 产 生 当 前 时 间 阶 的 初始 样本 。 无 论 采 用 哪 种 方式 ,构建 的 马 氏 链 都 将 收敛 
于 平稳 分 布 p(x |xzi,,)。 事 实 上 ,SAMC 采样 对 初始 样本 的 状态 依赖 较 小 ,考虑 使 
用 AR2 模型 或 先 验 密度 产生 初始 样本 是 基于 目标 运动 连续 性 的 假设 。 当 目标 运 
动 动力 学 表现 出 极 大 不 确定 性 时 ,Sequential SAMC 也 能 在 采样 过 程 中 覆盖 这 种 
不 确定 性 。 这 里 采用 AR2 模型 确定 of , 即 
2P ~N pÈ) (3.18) 
HP, N Ges SPAR PEPENDIT TU ITVPL NS x 为 
先前 时 间 阶 目标 状态 的 MAP 估计 ,A, 和 A, 定义 一 个 常 加 速度 的 AR2 模型 。 
(2) SAMC 采样 。SAMC 采样 阶段 的 任务 是 使 用 前 面 介 绍 的 SAMC 算法 构 
建 一 条 收敛 于 目标 分 布 的 马 氏 链 。 采 样 过 程 包 含 三 个 步 又 :样本 提议 、 样 本 接受 和 
工作 权重 更 新 。 
(D 样本 提议 阶段 。 此 阶段 的 任务 是 设计 和 选择 一 个 提议 分 布 9, 用 于 产生 候 
选 样本 。 我 们 考虑 一 个 局 部 高 斯 扰动 的 提议 分 布 : 
qC* ixi? OON C+ sp ©) (3, 19) 
其 中 ,均值 /为 当前 链 的 样本 状态 ein ,易于 验证 该 提议 分 布 满足 提议 的 全 局 性 
(Global) HSRC , 即 对 于 任意 的 zz'e 寺 ,都 有 dz'3z) 二 0。 全 局 性 提议 分 布 是 
确保 基于 目标 分 布 自 适应 的 SAMC 算法 的 必要 条 件 之 一 。 构 建 其 他 符合 全 局 性 
要 求 的 提议 分 布 也 是 可 行 的 ,但 这 种 基于 局 部 扰动 的 提议 是 最 为 简单 且 易 于 实现 
的 方案 之 一 。 在 第 4 章 中 我 们 将 介绍 更 为 复杂 的 提议 设计 方法 ,用 以 处 理 大 范围 
运动 突变 的 视觉 跟踪 问题 。 
O 样本 接受 阶段 。 给 定 马 氏 链 在 第 次 迭代 时 的 状态 xz 四 ,以 及 提议 gq 产生 
的 候选 后 续 样 本 x ,样本 接受 取决 于 Metropolis-Hastsings 接受 比 a(x’;z)。 值 
得 注意 的 是 ,此 时 的 目标 分 布 为 试验 分 布 ps (x,) ,而 不 是 原始 的 滤波 分 布 。 


/ [n] P 
1 DCL | zia) BIG) qG' 32) 
* m 


: (3. 20) 
pla zu gjen qGi? ix) 


ala’ 32”) 一 min| 

式 中 ,J(zx) 代 表 样 本 x 所 属 的 能 量子 区 域 的 索引 , 即 车 € AS MW J GO j. 
© 工作 权重 更 新 阶段 。 一旦 采样 算法 产生 一 个 新 的 样本 ,例如 x ,就 按照 式 
(3.14) 更 新 工作 权重 0。 这 意味 着 在 采样 过 程 中 态 密 度 项 的 估计 依赖 于 马 氏 链 的 
历史 样本 信息 3388 E — 7 B6 BL38 SK REA. SH EET. Wang-Landau 算 
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ik ,使 用 式 (3. 14) 的 随机 通 近 算法 对 态 密度 的 估计 更 为 有 效 。 随 着 采样 的 进行 ， 
SAP 能 够 持续 地 改进 态 密度 的 估计 精度 。 通 过 式 (3. 14) 和 式 (3. 19) 我 们 可 以 看 
到 ,一 旦 一 个 候选 样本 (例如 x ) 被 拒绝 , 马 氏 链 停留 在 原 地 且 当 前 样本 状态 值 被 保 
留 , 同 时 ,当前 样本 所 属 能 量 区 域 的 态 密 度 值 被 调 高 ,从 而 在 下 次 采样 时 从 当前 样 
本 状态 跳出 的 概率 增 大 。 与 此 同时 , 除 当 前 样本 所 属 的 能 量 区 域外 ,其 他 能 量子 区 
域 的 态 密度 值 被 调 低 ,使 得 下 次 采样 时 马 氏 链 跳跃 到 这 些 区 域 的 机 会 变 得 更 大 。 
这 种 工作 权重 ( 即 态 密度 ) 的 自 校正 机 制 使 得 对 滤波 分 布 的 采样 不 易于 陷入 局 部 模 
式 , 从 而 提高 在 复杂 多 模 情 况 下 的 采样 混合 性 ,使 得 通过 少量 粒子 达到 或 靠近 全 局 
最 优 模式 成 为 可 能 。 

G) 粒子 加 权 。 回 顾 粒 子 滤波 算法 ,包括 SIR! , Bootstrap 粒子 滤波 "中 和 
Condensation 中 等 ,每 个 粒子 在 产生 之 后 通过 特定 的 加 权 度 量 立 即 被 赋予 相应 的 
权重 ,在 后 续 的 采样 过 程 中 粒子 权重 始终 保持 不 变 。 而 在 MCMC-PF 中 ,由 于 
MCMC 算法 直接 从 后 验 分 布 中 采样 ,产生 的 粒子 集 以 滤波 分 布 为 平稳 分 布 ,因而 
无 须 加 权 操 作 。 

本 章 提 出 的 SAMC 算法 有 别 于 以 上 这 两 类 算法 。 尽 管 它 也 是 在 贝 叶 斯 滤波 
框架 下 使 用 MCMC 采样 算法 (SAMC) ,但 由 于 是 从 一 个 试验 分 布 中 采样 ,因而 产 
生 的 样本 集 以 试验 分 布 为 平稳 目标 分 布 。 按 照 重要 性 采样 理论 ,样本 集 通 过 重要 
性 加 权 后 将 近似 地 服从 原始 的 滤波 分 布 。 此 外 ,S-SAMC 算法 属于 动态 重要 性 采 
样 算法 的 范畴 "中 ,这 意味 着 在 构建 一 条 自 适应 马 氏 链 的 过 程 中 ,样本 的 权重 是 动 
态 估计 的 。 注 意 到 在 SAMC 采样 过 程 中 式 (3. 14)(SAP) 的 任务 正 是 在 线 学 习 这 
个 动态 权重 , 即 态 密度 项 。 使 用 一 个 SAP 在 线 估计 样本 权重 的 好 处 在 于 ,利用 在 
采样 过 程 中 收集 的 历史 样本 信息 指导 采样 向 高 后 验 密 度 区 域 偏 置 ,使 对 样本 权重 
的 估计 可 以 持续 地 被 改进 。 于 是 , 当 采 样 结束 并 获得 样本 集 {x 中 1X. p Gn Z 
后 ,可 通过 下 式 对 粒子 进行 加 权 : 

wf? = gy) i = 1,2, N (3.210 
使 得 {x sw? SN ~ pCa lei) ,其 中 ,JCz) 代 表 样 本 工 所 属 的 能 量子 区 域 的 索引 ， 
即 若 zE 心 , 则 J(z)=)。 在 使 用 S-SAMC 算法 获得 粒子 集 {zf2 wf? ) 六 ,后 ,可 通 
过 下 式 获 得 目标 状态 的 期 望 估计 : 


N 
ati 
war? 

~ anf 


z, = 5 (3. 22) 
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事实 上 ,对 于 动态 重要 性 采样 算法 ,有 如 下 的 定理 045] : 
定理 3.1 假定 使 用 SAMC 算法 从 SOFERRE? ,we )*_ ,并 满足 条 
件 式 (3.15) 和 (A. DD ,那么 对 任 一 可 积 函 数 h(x), 它 在 分 布 Jie pain 


式 进行 估计 : 
"m > wu? h GO) 
E,h(x) = 二 -一 (3. 23) 
Sw? 
i=l 


当 nxo0,Eh(z)>Ejh(z)。 其 中 条 件 (A.1) 表 述 如 下 : 

(A.1) id Ke 为 一 个 Metropolis-Hastings 转移 核 ,其 中 0€ 8B。 对 于 任意 的 0 
EO, K, 是 非 周期 不 可 约 的 。 此 外 ,存在 一 个 常数 a<2 和 函数 V: 站 -~[1,c) ,对 于 
任意 一 紧 集 KE 9, 都 有 : 

Ca) 存在 一 个 整数 LEO A 0.6.0770. LE AURI — BERE E RE v, 使 得 
supse c K&V* (x) SAV (xr) +b lr CLV EX; 
supose KoV" Cr) < £V* Gr). Vx € X; 
infse Ki(x,A), Vr € £, VA € Bis 


其 中 ,BY 是 定义 于 样本 空间 世上 的 Borel R, KV) = |. Ki Geo VG2dy. 


Cb) 存在 一 常数 c 使 得 对 任意 (0,0 ERX ADA 
| Keg — Keglv & clglv 10—0 |. Vg € £v; 
| Kg — Keglv < clgle 10—0 |. Vg € £v; 
xn.lglv—sup.erlgG2/VGOl;:£v— (g:X— R".lglv«o9). 
由 定理 3. 1 易于 验证 当 N->co ,由 式 (3.21) 估 计 的 之 收敛 于 目标 状态 的 期 
望 。 综 合 以 上 分 析 ,S-SAMC 采样 算法 描述 如 下 : 
算法 输入 : ATE 2 swa 
算法 输出 : ATR P w), Ri n. 
CD 初始 化 
- REB AT Gn, 
一 Wife LIEBE g;—1.i—1.2. m 


(D TORRE La, als, PAAR I (hex 
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G) 按照 式 (3. 19) 产 生 初 始 样本 zf" s 
(4) For i=l to N 
— ERG. 19) 抽 取 候 选 样本 z ~ qlee?) 
- 按照 式 (3. 20) 计 算 接受 比 a 
- 以 概率 a 接受 x! ,并 令 cP =2'; 否则 令 cP =z? 
- 按 式 (3. 14) 更 新 工作 权重 
End For 
(5) 粒子 加 权 
— 按 式 (3. 21) 对 样本 集 加 权 
- 归 一 化 粒子 集 
(6) 按 式 (3. 22) 估 计 目 标 状态 的 期 望 2, 
3. S-SAMC 跟踪 方法 
由 前 面 的 算法 分 析 可 以 看 到 ,本 章 提出 的 SSAMC 算法 与 粒子 滤波 .MCMC- 
PF 等 算法 类 似 , 都 是 对 贝 叶 斯 滤波 问题 的 一 种 算法 实现 。 因 而 当 S-SAMC 采样 
算法 应 用 于 视觉 跟踪 时 , 它 是 一 个 较为 通用 的 一 个 视觉 跟踪 框架 。 它 能 够 依照 不 
同 的 跟踪 应 用 容纳 不 同 的 观察 模型 、 先 验 模型 和 目标 表示 。 本 节 讨 论 基 于 S- 
SAMC 采样 的 视觉 跟踪 方法 ,涉及 目标 表示 、 运 动 先 验 、 观 测 模型 和 参数 设置 等 方 
面 的 内 容 。 
考虑 二 维 的 视觉 跟踪 ,目标 采用 简单 的 矩形 框 描述 ,状态 变量 定义 为 += Qu. 
vss). 
其 中 , (u,v) 表 示 目 标的 位 置 ;s 为 目标 尺度 。 为 简化 跟踪 算法 的 实现 ,我 们 采用 基 
于 模板 表示 的 颜色 外 观 模型 23 。 具 体 地 ,我 们 采用 基于 HSV 颜色 直方 图 外 观 模 
型 ,颜色 直方 图 量化 为 110 bins, 其 中 N, 一 NN, 二 NN, 二 10。 基 于 颜色 外 观 模型 的 似 
然 定义 为 
plz, | x) = APU HGP , (3. 24) 
xUB.IH 表示 目标 的 参考 模型 ;有 H(zx,) 为 候选 状态 r 处 的 目标 模型 ;4. 为 预 置 参 
数 ;d 为 基于 颜色 直方 图 的 Bhattacharyya 距离 : 
d(H* HG) = J/1—pCH* HG). (3. 25) 
式 中 ,o Jy Bhattacharyya 相似 系数 。 考 虑 一 个 分 块 的 目标 表示 模型 (如 图 3-4 所 
示 ), 目 标 区 域 R(x,) 被 分 解 为 7 个 子 区 域 . 即 


RC) = OR (x) 
i=l 
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图 3-4 基于 分 块 的 目标 表示 。 图 中 目标 被 分 成 四 个 矩形 块 ， 
各 分 块 的 颜色 直方 图 独立 构建 ,目标 观测 似 然 由 式 (3.25) 度 量 。 


在 这 个 基于 分 块 的 目标 表示 下 ,各 个 子 区 域 的 颜色 直方 图 独立 地 构建 函数 。 
此 时 ,外 观 似 然 可 以 重 写 为 


ple, | x) = ee TE Hep (3. 26) 

本 章 提出 的 SSAMC 跟踪 算法 能 够 有 效 地 处 理 目标 状态 的 不 确定 性 ,为 了 验 
证 算法 的 这 一 性 能 ,我 们 在 算法 实现 中 仅 采用 一 个 简单 的 目标 运动 模型 作为 目标 
状态 演化 的 先 验 模型 : 

PCa lx ~N Gr sg 3) 3, 27) 
RPN GX HH um aic tasca E28 39 22 B 8 HA s asa: 定义 
一 个 常 加 速度 AR2 模型 。 在 本 章 的 实验 部 分 可 以 看 到 ,即使 使 用 这 样 一 个 弱 
的 运动 模型 ,我 们 提出 的 跟踪 算法 也 能 够 有 效 地 处 理 目标 运动 的 极 大 不 确 
定性 。 

此 外 ,S-SAMC 算法 涉及 多 个 重要 参数 ,我 们 做 个 简要 的 分 析 。 对 于 样本 空间 
的 划分 ,为 简化 处 理 通常 将 样本 空间 划分 为 等 能 量 带 的 多 个 子 区 域 。Liang 等 
人 [中 指出 ,每 个 子 区 域 的 能 量 差 (带宽 ) 不 应 超过 2. 0, 即 Au; 2.0.1 1.2, m 
一 1, 以 确保 马 氏 链 在 各 个 子 区 域 有 一 定 的 接受 率 。 对 于 在 各 个 能 量子 区 域 的 期 望 


采样 频率 (分 布 )$, 我 们 简单 地 设置 为 均匀 分 布 , 即 加 一 直 ,i 一 1,2,…,m。 原 则 
上 ,将 采样 偏 置 到 低能 量 区 域 通常 可 以 集中 计算 资源 在 高 后 验 密度 区 域 ,从 而 有 助 
于 提高 整体 采样 效率 。 然 而 由 于 我 们 希望 获得 目标 状态 期 望 的 无 偏 估计 ,因而 将 
g 设置 为 均匀 分 布 , 详 见 文献 [145] 有 关 SAMC 渐进 收敛 的 讨论 。 对 于 SAP 的 增 
益 因子 (学 习 率 )X, 式 (3.16) 中 的 ko 越 大 ,通常 意味 着 采样 能 够 较 快 地 访问 到 各 
个 能 量子 区 域 。 
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€ 3.4 实验 结果 参 


为 评估 提出 的 SSAMC 算法 在 视觉 跟踪 应 用 中 的 性 能 ,在 实验 中 使 用 了 多 个 
测试 视频 ,视频 场景 涉及 多 个 相似 目标 、 多 种 目标 运动 的 不 确定 性 ,包括 目标 运动 
动力 学 突然 改变 ,快速 运动 等 。 在 实验 中 ,我 们 与 几 种 当前 主流 的 视觉 跟踪 算法 进 
行 了 比较 ,包括 Bootstrap 粒子 滤波 (以 下 简称 BPF)U ,基于 Mean Shift 的 跟踪 算 
法 (以 下 简称 MSE ,以 及 基于 MCMC 采样 的 粒子 滤波 算法 (以 下 简称 MCMC- 
PF) 。 为 公平 比较 ,所 有 四 个 跟踪 算法 都 使 用 相同 的 观测 模型 和 似 然 度量 。 
BPF,MCMC-PF 和 S-SAMC 使 用 相同 的 运动 先 验 模型 。MCMC-PF 和 S-SAMC 
使 用 相同 的 提议 分 布 。 

在 我 们 的 算法 实现 中 , 似 然 函数 的 参数 4. 设 为 20, 样 本 空间 划分 为 50 个 等 能 
量 带宽 的 子 区 域 , 即 Awu; 二 0.4,i 二 1,2,…,49。 增 益 因 子 中 ko 值 设 为 所 用 的 样本 
数量 的 两 倍 , 即 二 2N。 先 验 分 布 和 提议 分 布 的 协 方差 矩阵 设 定 为 光 = diag(4?， 
OY 

首先 ,我 们 在 一 个 壁球 比赛 的 视频 序列 Squash 上 测试 四 种 跟踪 算法 的 性 能 。 
Squash 视频 中 待 跟踪 的 目标 为 穿 白色 上 衣 的 运动 员 , 它 在 序列 中 来 回 快速 跑 动 击 
球 使 得 其 自身 动力 学 特征 具有 很 大 的 不 确定 性 ,因而 用 一 个 弱 的 运动 模型 很 难 有 
效 预 测 和 覆盖 其 运动 范围 。 在 这 个 实验 中 ,三 种 基于 采样 的 跟踪 算法 :BPF、MC- 
MC-PF 和 S-SAMC 各 使 用 500 个 粒子 。 图 3-5 所 示 为 四 种 不 同 跟 踪 算 法 在 
Squash 序列 上 的 部 分 跟踪 结果 。 从 图 3-5 中 可 以 看 到 ,我 们 提出 的 SSSAMC 算法 
能 够 有 效 地 跟踪 到 快速 运动 的 目标 , 当 目 标 动 力学 改变 时 (例如 突然 启动 或 变 向 ) 
S-SAMC 也 能 捕获 这 种 具有 很 大 不 确定 性 的 目标 运动 。 同 时 可 以 看 到 , 当 两 个 运 
动 目标 靠近 后 (#35),MS 算法 最 先 产生 目标 漂移 ,最 终 因 陷入 局 部 模式 而 导致 跟 
踪 失 败 , 并 且 很 难 从 失败 中 恢复 。 另 一 方面 .BPF 和 MCMC-PF 算法 在 目标 产生 
相互 靠近 ,遮挡 或 快速 运动 、 变 向 运动 时 容易 产生 跟踪 漂移 并 导致 跟踪 失败 ,但 与 
MS 算法 不 同 的 是 ,BPF 和 MCMC-PF 能 够 较 快 地 从 跟踪 失败 中 恢复 目标 轨迹 。 

其 次 ,我 们 定性 地 评估 了 四 种 算法 在 另 一 个 测试 视频 Pingpong 上 的 性 能 。 测 
试 视频 中 乒乓 球 运动 具有 极 大 的 不 确定 性 。 当 乒乓 球 在 下 落 撞击 到 球拍 后 反弹 ， 
这 一 碰撞 前 后 目标 的 动力 学 特征 发 生 突然 改变 。 从 类 似 的 训练 视频 中 学 习 一 个 或 
多 个 较为 精确 的 运动 模型 是 可 能 的 ,例如 文献 [86,87], 但 这 种 方式 依赖 于 一 个 离 
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图 3-5 四 种 不 同 算法 在 视频 Squash 上 的 部 分 跟踪 结果 。 其 中 ,S-SAMC,BPF， 
MCMC-PF 各 使 用 500 个 粒子 , 且 使 用 相同 的 运动 先 验 模 型 ; 
四 种 算法 使 用 相同 的 观测 度量 模型 。 

线 的 训练 过 程 , 因 而 可 扩展 性 较 差 。 我 们 的 实验 表明 ,仅仅 采用 一 个 弱 运 动 模型 ， 
S-SAMC 算法 使 用 500 个 粒子 就 可 以 有 效 地 跟踪 具有 极 大 不 确定 性 运动 特征 的 乒 
乓 球 。 部 分 跟踪 结果 如 图 3-6 所 示 。 采 用 相同 的 运动 模型 和 外 观 度 量 , BPF 和 
MCMC-PF 即使 使 用 1 000 个 粒子 ,仍然 无 法 有 效 地 跟踪 目标 运动 的 不 确定 性 ,从 
而 频繁 地 发 生 跟踪 失败 。 

此 外 ,我 们 在 多 个 测试 视频 上 定量 评估 了 四 种 算法 的 跟踪 性 能 。 图 3-7 和 图 
3-8 所 示 为 不 同 算法 在 Squash 和 Pingpong 序列 上 的 跟踪 位 置 错 误 (像素 )。 表 3-1 
所 示 为 四 种 算法 在 两 个 测试 视频 上 的 相对 位 置 错误 (Relative Position Error， 
RPE), RPE" @ YW 


a = 19 = 049], (3. 28) 


Sg 


式 中 ,us o, s, 为 测试 视频 中 目标 的 真实 (基准 ) 状 态 , 它 通常 通过 人 为 标注 生成 。 
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图 3-6 ”四 种 不 同 算法 在 视频 Pingpong 上 的 部 分 跟踪 结果 。 其 中 ,S-SAMC 使 用 500 个 粒子 ， 
BPF 和 MCMC-PF 各 使 用 1 000 个 粒子 ;四 种 算法 使 用 相同 的 观测 度量 模型 。 


一 


(a)S-SAMC 


E 


(b)BPF 


200 T T T T T T T T 
BPF 
MCMC-PF 
150 f MS | 
S-SAMC 
* 
x 
EK 100 
E 
ihi 
d 
50 
pb A | | ^ 人 
| TN b Y hat 1 NEN TET LO 
ES AA s lid ox UNS No ad Vu v di fuss RT Ata PANN 
0 50 100 150 200 250 300 350 400 


帧 号 


图 3-7 四 种 不 同 算法 在 视频 Squash. 上 的 部 分 跟踪 结果 曲线 示意 。 其 中 ,S-SAMC， 
BPF 和 MCMC-PF 各 使 用 500 个 粒子 ;四 种 算法 使 用 相同 的 观测 度量 模型 。 
使 用 RPE 度量 的 目的 是 便于 在 目标 大 小 不 同 的 情况 下 进行 跟踪 精度 的 比较 。 从 
图 3-7 和 图 3-8 以 及 表 3-1 可 以 清楚 地 看 到 ,三 种 基于 随机 采样 的 跟踪 算法 相 比 
MS 跟踪 算法 有 着 更 好 的 跟踪 成 功率 和 精确 度 。 同 时 ,我 们 提出 的 S-SAMC 算法 
相 比 其 他 三 种 算法 在 跟踪 成 功率 、 精 确 度 以 及 稳定 性 方面 都 有 显著 的 提高 。 
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图 3-8 四 种 不 同 算法 在 视频 Pingpong 上 的 部 分 跟踪 结果 曲线 示意 。 
其 中 ,S-SAMC 使 用 500 个 粒子 ,BPF 和 MCMC-PF 各 使 用 1000 个 粒子 ; 
四 种 算法 使 用 相同 的 观测 度量 模型 。 


表 3-1 四 种 不 同 跟踪 算法 在 测试 视频 上 的 跟踪 性 能 (相对 位 置 错误 ) 


Pingpong Squash 
跟踪 算法 
d, d, m d 
MS 9. 6386 2.6260 3. 0289 1.7353 
BPF 0.6515 1.6989 0. 2679 0. 3838 
MCMC-PF 0. 6619 1.4570 0.2414 0. 3275 
S-SAMC 0. 1233 0.0735 0.1605 0.1515 


@ 3.5 小 结 人 参 


本 童 探讨 了 贝 叶 斯 滤波 跟踪 问题 ,研究 了 贝 叶 斯 滤波 问题 的 多 种 实现 算法 , 包 
括 粒 子 滤波 及 其 多 种 变 体 .基于 MCMC 采样 的 粒子 滤波 算法 等 。 通 过 理论 分 析 和 
实验 验证 我 们 可 以 看 到 ,传统 的 粒子 滤波 算法 和 基于 MCMC 采样 的 粒子 滤波 算法 
在 对 复杂 多 模 的 滤波 分 布 进行 序 贯 采样 时 都 存在 易于 陷入 局 部 模式 的 缺陷 ,这 使 
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得 采样 算法 往往 需要 使 用 大 量 的 粒子 近似 滤波 分 布 。 本 章 通 过 将 SAMC 采样 方 
法 引入 到 贝 叶 斯 滤波 框架 ,提出 一 种 动态 加 权 的 重要 性 采样 算法 , 即 SSAMC 采 
样 算法 , 它 能 够 有 效 地 避免 采样 过 陷入 局 部 模式 ,从 而 显著 地 提供 采样 效率 。 基 于 
S-SAMC 采样 的 跟踪 算法 是 一 个 通用 的 视觉 跟踪 框架 , 它 易于 集成 更 为 有 效 地 提 
议 分 布 . 观 测 模型 和 目标 表示 来 进一步 提高 跟踪 性 能 。 
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在 视觉 跟踪 研究 领域 ,大 多 数 跟踪 算法 都 基于 一 个 假设 , 即 目标 运动 (状态 变 
化 ) 和 外 观 变 化 的 连续 性 。 然 而 ,在 许多 复杂 的 场景 中 ,这 种 连续 性 假设 并 不 符合 
实际 情况 。 如 图 4-1 所 示 ,一 些 体育 竞技 比赛 中 经 常 出 现 目标 运动 极 大 不 确定 性 
的 情形 。 事 实 上 ,运动 连续 性 假设 对 视觉 跟踪 至 关 重要 ,这 是 由 于 连续 性 假设 通常 
有 利于 跟踪 算法 可 以 在 较 小 的 状态 空间 中 建 模 目标 的 运动 ,使 得 在 有 限 的 计算 资 
源 条 件 下 实现 可 靠 的 跟踪 任务 。 一 旦 这 种 连续 性 假设 不 再 成 立 ,那么 就 需要 在 状 
态 空 间 中 扩大 搜索 (采样 ) 范 围 来 估计 目标 的 状态 ,这 通常 需要 增加 大 量 的 样本 ( 粒 
子 或 迭代 ) 来 实现 在 庞大 的 方案 空间 中 进行 有 效 地 采样 。 
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图 4-1 拳击 比赛 视频 中 因 镜 头 切换 引起 的 目标 运动 突变 
在 视觉 跟踪 领域 ,目标 的 运动 突变 主要 包括 :目标 自身 动力 学 特性 的 极 大 不 确 
定性 、 外 在 因素 影响 的 动力 学 改变 ,摄像 机 镜头 切换 、 低 帧 率 视频 等 。 回 顾 本 书 第 
3 章 提出 的 基于 S-SAMC 采样 的 视觉 跟踪 方法 。 它 是 一 个 通用 的 视觉 跟踪 框架 ， 
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通过 使 用 一 个 简单 的 运动 模型 和 外 观 模型 , 它 能 够 有 效 地 处 理 一 定 程 度 的 目标 运 
动 不 确 定性 ,例如 在 Squash 和 Pingpong 视频 上 的 实验 证 实 了 这 一 点 。 值 得 注意 
的 是 ,S-SAMC 跟踪 算法 在 处 理 不 确定 性 动力 学 特征 的 目标 跟踪 问题 时 仍然 使 用 
了 相当 数量 的 粒子 数目 ,这 也 意味 着 计算 代价 仍然 较 高 ,对 于 一 些 实时 跟踪 应 用 来 
说 采样 效率 仍然 有 待 进一步 提高 。 为 了 有 效 地 处 理 范围 更 大 的 运动 不 确定 性 问 
题 , 即 多 种 运动 突变 的 视觉 跟踪 问题 ,本 章 在 SSAMC 跟踪 算法 的 基础 上 研究 如 
何 进一步 提高 采样 效率 的 方法 和 技术 ,实现 一 个 能 够 有 效 处 理 运动 突变 的 视觉 跟 
踪 问 题 的 算法 。 我 们 解决 这 一 问题 的 基本 思想 是 对 第 3 章 提 出 的 SSAMC 采样 
算法 进一步 的 “ 自 适 应 ”, 并 提出 一 个 强 自 适应 的 MCMC 采样 算法 实现 对 滤波 分 布 
更 高 效 地 采样 ,从 而 进一步 提高 跟踪 性 能 ,降低 计算 复杂 度 。 
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较 早 对 目标 跟踪 中 的 运动 动力 学 特性 进行 研究 的 是 Blake AC, 他们 从 特 
定 场 景 的 训练 数据 中 学 习 动 力学 特征 并 用 于 动力 学 变化 的 状态 建 模 。 这 种 基于 运动 
特征 学 习 的 方法 对 于 具有 一 定 运 动 模式 的 特定 场景 下 的 跟踪 被 认为 是 可 行 的 。 然 而 
由 于 基于 特定 的 训练 集 , 这 种 方法 很 难 适合 于 一 般 性 目标 的 跟踪 ,因而 可 扩展 性 较 
差 , 难 以 应 用 于 低 帧 率 视频 等 复杂 运动 条 件 下 的 视觉 跟踪 任务 。 多 尺度 和 分 层 采样 
的 策略 是 处 理 目标 运动 不 连续 问题 的 另外 一 种 方案 。 在 贝 叶 斯 框架 下 ,Sullivan 等 
人 [中 结合 不 同 尺度 下 的 图 像 观 测 ,提出 在 状态 空间 中 进行 有 效 搜索 的 跟踪 方案 。 这 
种 方法 的 缺点 是 ,大 尺度 下 的 不 准确 的 推断 将 导致 在 原始 尺度 下 目标 搜索 的 失败 。 
针对 这 一 困难 ,Hua 等 人 5 提出 在 多 尺度 下 的 一 种 基于 动态 马尔 科 夫 网 络 的 合作 搜 
索 策略 ,并 设计 了 一 个 序 贯 信念 传播 算法 以 实现 更 为 准确 的 贝 叶 斯 推断 。 

针对 低 帧 率 情况 下 的 视觉 跟踪 问题 ,Li 等 人 中 提 出 使 用 一 个 级 联 的 粒子 滤波 
器 结合 多 个 在 线 (或 离线 ) 学 习 到 的 检测 模型 来 提高 粒子 采样 效率 和 目标 跟踪 准确 
度 。 该 方法 在 多 个 测试 实例 中 取得 较 好 的 跟踪 效果 。 然 而 , 它 需 要 一 个 事先 训练 
好 的 可 靠 的 观测 模型 和 一 个 离线 的 学 习 过 程 ,此 外 , 它 不 能 处 理 大 范围 快速 运动 的 
目标 跟踪 ,如 多 摄像 机 镜头 切换 等 。 最 近 ,Kwon 和 Lee 中 提出 了 一 种 基于 Wang- 
Landau 算法 "的 能 够 处 理 多 种 运动 突变 的 目标 跟踪 算法 。 其 基本 思想 是 使 用 
Wang-Landau 算法 在 整个 样本 空间 中 对 滤波 分 布 进行 全 局 采样 从 而 避免 陷入 局 
部 最 优 模式 。 由 于 能 有 效 地 避免 在 采样 过 程 中 陷入 局 部 最 优 状态 ,这 种 方法 在 多 
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种 不 连续 运动 场景 中 取得 了 很 好 的 跟踪 结果 。 然 而 ,该 方法 所 使 用 的 提议 分 布 是 
基于 均匀 分 布 的 全 局 跳跃 模式 ,没有 考虑 局 部 模式 的 细节 探索 ,尽管 作者 使 用 了 一 
个 退火 模式 来 分 阶段 压缩 样本 空间 ,整个 采样 过 程 仍然 需要 相当 数目 的 粒子 来 近 
似 复杂 的 滤波 分 布 ,因而 在 实际 应 用 中 , 离 实 时 跟踪 需要 还 有 一 定 的 距离 。 此 外 ， 
尽管 Wang-Landau 算法 在 统计 物理 学 中 的 应 用 取得 了 很 大 的 成 功 ,但 是 至 今 还 没 
有 坚实 的 理论 证 明 Wang-Landau 算法 在 一 般 状态 空间 中 的 收敛 性 ,并 且 在 一 些 统 
计 学 和 物理 学 应 用 中 已 发 现 它 只 能 取得 有 限 的 统计 精度 5 。 


€ 4.3 方法 介绍 参 


从 前 面 的 介绍 可 以 看 到 ,在 众多 视觉 跟踪 算法 中 专门 对 运动 突变 的 目标 跟踪 
问题 进行 研究 的 工作 较 少 ,能 够 有 效 处 理 运动 突变 的 视觉 跟踪 算法 就 更 为 稀少 。 
实践 证 明 %" 针 ,基于 自 适应 MCMC 采样 的 视觉 跟踪 方法 是 解决 这 一 问题 的 有 效 
途径 之 一 。 本 节 介绍 如 何 通过 “目标 分 布 自 适应 ”和 ”提议 分 布 自 适应 ”构建 一 个 强 
自 适应 的 MCMC(Intensively Adaptive MCMC, IA-MCMC) 采 样 方法 ,并 基于 此 
采样 策略 设计 一 个 能 够 有 效 解决 运动 突变 的 视觉 跟踪 算法 。 


4.3.1 基本 思想 


对 于 运动 突变 的 视觉 跟踪 问题 ,场景 中 目标 状态 在 前 后 相继 两 帧 之 间 的 上 下 
文 信息 通常 显得 很 微弱 ,或 者 是 完全 丢失 了 上 下 文 信息 ,这 使 得 目标 跟踪 变 得 非常 
困难 。 回 想 第 3 章 介绍 的 SSAMC 跟踪 算法 , 它 在 处 理 目 标 运动 不 确定 性 时 采用 
了 一 个 多 元 高 斯 作为 提议 分 布 。 该 提议 分 布 是 一 种 较为 常用 的 处 理 方法 ,通过 增 
大 方差 ( 即 扩大 延展 度 ) 可 以 扩大 在 样本 空间 中 的 采样 范围 ,但 是 这 种 方式 需要 大 
量 的 粒子 (迭代 ) 以 便 提 议 分 布 产生 的 候选 样本 能 够 有 更 多 的 机 会 “命中 ”庞大 样本 
空间 中 的 目标 模式 。 

有 别 于 S-SAMC 算法 中 采用 的 基于 局 部 高 斯 扰动 的 提议 分 布 , 我 们 试图 考虑 
一 种 更 为 有 效 的 方案 。 它 应 该 既 能 产生 局 部 范围 的 候选 样本 ,也 能 产生 大 范围 全 
局 跳跃 的 候选 样本 。 具 体 到 采样 算法 , 它 应 该 既 能 在 局 部 范围 内 进行 模式 细节 的 
提炼 ,也 能 在 样本 空间 中 多 个 模式 之 间 全 局 跳跃 ,从 而 提高 采样 的 混合 性 。 基 于 这 
一 思路 ,我 们 首先 考虑 使 用 一 个 网 格 (Grid) 将 样本 空间 划分 为 许多 个 单元 (Cell)。 
假定 一 个 p 维 的 样本 空间 XAS1 X S, X…XS,,XCR*。 对 于 每 一 维度 i€ {1,2， 
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S fu Tal S;, 网 格 将 其 划分 为 n 个 区 间 (Interval), 即 S; — (S4,;)55,.. E T FE 
本 空间 由 = [T 个 单元 组 成 ,每 个 单元 可 以 表示 为 
CAS X Sj, X X Sij, Xe XSu. i€ O2 ph ads € 0,2, n), 
(4.1) 
TE EWC) A Usar jin ja IRER xz 一 (zz texit ,zp) 所 属 的 单 
WWA € S; 。 基 于 这 一 样本 空间 划分 方式 ,我们 考虑 如 下 提议 分 布 : 
QGz'iz)=AACz'iz, 卫 ) 十 (1 一 iD)Q(z'3z)， (4.2) 
其 中 ,N(x, 沁 ) ,表示 均值 为 p= 
工 方差 为 沁 的 高 斯 分 布 ;Q, Cz 
ax) E LF RRS’ = ANCQGO E 
的 均匀 分 布 ,EL0,1] 控 制 提议 
操作 在 局 部 高 斯 扰动 与 全 局 随机 
跳跃 之 间 的 平衡 。 易 于 验证 该 提 
议 分 布 满 足 转移 核 的 全 局 性 要 
求 , 即 对 任意 rr et 都 有 Q 
Gr 132220, Al 4-2 所 示 为 该 提 
议 分 布 在 二 维 样本 空间 的 一 个 图 42 提议 分 布 Q(z ;zx) 在 二 维 样本 空间 的 示意 。 


描述 。 样本 空间 被 一 离散 网 格 划分 为 5X5 的 单元 阵 。 
的 确 , 在 SSAMC 算法 中 使 该 提议 分 布 即 考虑 了 局 部 随机 游 走 ( 实 线 )， 
用 提议 分 布 式 (4. 2) 替 代 式 (3. 也 兼顾 了 全 局 随机 跳跃 (虚线 ) 。 


19) 能 够 更 为 有 效 地 实现 运动 突变 的 目标 跟踪 ( 见 本 章 实验 部 分 )。 然 而 ,为 确保 跟 
踪 的 稳健 性 ,仍然 需要 相当 数量 的 粒子 来 覆盖 运动 的 极 大 不 确定 性 。 这 是 由 于 无 
论 是 提议 分 布 式 (4.2) 还 是 式 (3. 190 ,都 采用 固定 的 转移 核 。 由 于 突变 运动 往往 造 
成 场景 上 下 文 信息 的 缺失 或 极其 微弱 ,在 这 种 情况 下 使 用 一 个 固定 不 变 的 转移 核 
容易 造成 提议 的 候选 样本 被 频繁 的 拒绝 ,尤其 是 在 高 维 状 态 空间 的 情形 下 。 为 进 
一 步 提高 采样 效率 ,必须 考虑 更 为 有 效 的 采样 策略 。 

回顾 S-SAMC 算法 在 MCMC 采样 框架 中 使 用 一 个 SAP 在 线 学 习 工 作 权 重 ， 
从 而 有 效 地 避免 采样 陷入 局 部 模式 。 在 此 基础 上 ,我 们 考虑 对 该 采样 算法 进行 进 
一 步 的 “ 自 适 应 ”, 具 体 地 说 ,就 是 将 其 使 用 的 不 变 的 提议 分 布 蔡 换 为 在 线 学 习 的 自 
适应 提议 分 布 。 提 议 分 布 的 学 习 主 要 基于 S-SAMC 算法 构建 的 非 齐 次 马 氏 链 上 
的 历史 样本 信息 。 直 观 上 看 ,我 们 希望 通过 对 历史 样本 信息 的 分 析 来 估计 样本 空 
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间 中 哪些 区 域 是 “有 和 希望 的 ”(Promising) 区 域 , 即 极 有 可 能 存在 目标 模式 的 高 置信 
度 区 域 。 基 于 这 样 的 区 域 划 分 ,后 续 的 采样 过 程 将 偏 置 到 这 些 高 置信 度 区 域 ,从 而 
提高 采样 效率 。 为 了 实现 这 个 策略 ,我 们 在 SAMC 采样 中 引入 一 个 基于 密度 网 格 
的 预测 模型 ,构建 一 个 “采样 一 预测 一 采样 ”的 采样 循环 。 在 我 们 的 采样 策略 中 , 密 
度 网 格 携带 了 滤波 分 布 在 样本 空间 的 统计 信息 ,具体 到 突变 运动 跟踪 应 用 中 ,样本 
空间 中 “有 希望 的 ”区 域 对 应 于 那些 高 后 验 概率 区 域 , 即 那些 可 能 存在 目标 的 区 域 。 
考虑 在 SAMC 采样 中 使 用 基于 密度 网 格 的 预测 模型 的 原因 在 于 :密度 网 格 模 
型 力图 估计 样本 空间 的 高 置信 和 度 区 域 ,使 得 从 这 些 区 域 抽取 的 样本 相 比 于 从 整个 
样本 空间 中 均匀 地 抽取 的 样本 有 更 大 的 机 会 靠近 或 达到 全 局 最 近 模 式 点 ; 另 一 方 
面 ,SAMC 采样 能 确保 采样 的 全 局 性 ,避免 采样 陷入 局 部 模式 ,并 产生 有 代表 性 的 
样本 。 直 观 上 看 ,这 种 局 部 预测 与 全 局 采样 相 结合 的 策略 有 助 于 提高 采样 的 混合 
人 性。 事实 上 ,这 一 采样 策略 是 TA-MCMC 采样 方法 ,其 中 目标 分 布 自 适应 的 任务 是 
避免 采样 陷入 局 部 模式 ,而 提议 分 布 自 适 应 则 力图 提高 采样 效率 。 图 4-3 描述 了 
贝 叶 斯 滤波 框架 下 的 IA-MCMC 采样 方法 的 基本 原理 。 


esj 
Promising , 
regions 1 
$ 


IA-MCMC i 


图 4-3 贝 叶 斯 滤波 框架 下 的 深度 自 适应 MCMC 采样 方法 


4.3.2 密度 网 格 


本 节 主 要 介绍 密度 网 格 结构 及 其 相关 操作 , 它 是 IA-MCMC 中 为 实现 提议 分 
布 自 适应 而 构建 的 预测 模型 的 基础 。 值 得 注意 的 是 ,本 节 介 绍 的 密度 网 格 模 型 与 
文献 [146] 描 述 的 聚 类 模型 尽管 在 概念 上 有 些 相 似 , 但 在 模型 属性 和 应 用 目的 方面 
都 有 着 本 质 的 不 同 。 后 者 是 基于 “无 权重 ”的 流 数 据 并 用 于 聚 类 ,而 前 者 则 使 用 带 
有 滤波 分 布 信息 (能 量 ) 的 样本 进行 高 置信 度 区 域 预测 。 

密度 网 格 结构 是 在 本 章 4. 3. 1 节 介 绍 的 网 格 结构 通过 引入 单元 (Cell) 的 密度 
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概念 扩展 而 成 的 。 令 G 表示 一 个 密度 网 格 结构 ,其 中 每 一 个 单元 初始 化 值 为 0。 
对 于 每 一 个 由 S-SAMC 算法 抽取 的 样本 x, ,为 其 赋予 一 个 密度 系数 , 即 

disp =a (4.3) 
式 中 ,E(xz,) 二 -log p(x, | ziu) ,表示 滤波 分 布 的 能 量 函 数 。 密 度 系数 的 概念 的 直观 
意义 是 ,在 采样 过 程 中 密度 网 格 模型 为 具有 较 低 能 量 值 的 样本 赋予 较 大 的 权重 ,以 
便 更 有 效 地 发 现 和 提炼 样本 空间 中 的 高 置信 度 区 域 。 基 于 密度 系数 的 概念 ,密度 
网 格 中 每 一 单元 的 密度 值 可 以 方便 地 计算 得 到 。 对 于 单元 C, 在 第 & 次 迭代 时 其 
密度 等 于 落 入 该 单元 的 所 有 历史 样本 的 密度 系数 之 和 , 即 


k 
D(C,k) = Maa? EC) (4.4) 


现在 考虑 基于 此 密度 网 格 结构 构建 一 个 预测 模型 。 我 们 定义 具有 和 较 高 密度 值 的 单 
元 为 高 置信 度 区 域 。 令 DP 表示 在 第 次 迭代 时 的 密度 国 值 ,此 时 高 轿 信 和 度 区 域 
定义 为 

y^ = {C:D(C,k) > DP) (4.5) 
Jt uo RATH a BE BL (fl DSP 设 定 为 第 k 次 迭代 时 所 有 单元 密度 值 的 平均 。 随 着 
采样 的 进行 ,样本 空间 中 高 置信 和 度 区 域 会 连续 地 得 到 更 新 和 提炼 ,这 是 因为 在 采样 
过 程 中 每 个 单元 的 密度 都 是 动态 变化 的 ,密度 阔 值 也 是 动态 更 新 的 。 从 数据 挖掘 
的 观点 来 看 ,这 一 密度 网 格 模型 可 以 看 作 一 个 在 线 的 预测 模型 , 它 把 样本 空间 动态 
地 划分 为 高 置信 度 区 域 和 非 高 置信 度 区 域 。 这 一 模型 尽管 较为 简单 ,但 对 于 学 习 
自 适应 的 提议 分 布 却 很 有 效 。 


4.3.3 提议 分 布 自 适 应 


如 图 4-3 所 示 ,在 IA-MCMC 采样 方法 中 存在 两 个 在 线 学 习 过 程 :工作 权重 
( 即 态 密度 项 ) 的 估计 是 通过 SAMC 采样 算法 中 的 一 个 SAP 实现 的 , 它 使 采样 避 
免 陷 入 局 部 模式 ;在 这 一 节 里 ,我 们 将 讨论 借助 密度 网 格 模型 实现 另 一 个 在 线 学 习 
过 程 , 即 提议 分 布 自 适应 ,其 目的 是 学 习 更 加 有 效 的 提议 分 布 并 偏 置 采样 到 样本 空 
间 中 高 置信 度 区 域 ,从 而 提高 采样 效率 。 

由 密度 网 格 预测 得 到 的 高 置信 度 区 域 可 能 包含 多 个 密度 单元 。 记 zw 为 高 置 
信和 度 密 度 单元 的 个 数 ;C4 为 在 第 & 次 迭代 时 第 i hi BE ot. SQ” 表示 
第 & 次 迭代 时 与 第 i 个 高 置信 度 区 域 相 关联 的 提议 分 布 。 给 定 当 前 样本 at? ,原则 
上 ,我们 希望 以 一 个 较 大 的 概率 值 从 高 置信 度 区 域 中 抽取 一 个 样本 。 考 虑 如 下 的 
提议 分 布 : 


76 


第 4 章 运动 突变 的 视觉 跟踪 方法 《 
QP CrP) = Bi? PIHA sz), i=1,2,,n®, 
(4. 6) 
其 中 ,6 为 从 高 置信 度 区 域 抽取 样本 的 概率 ;gi” 表 示 直 接 从 第 i 个 高 置信 和 度 区 域 产 
生 样 本 的 提议 分 布 ;g® 表示 从 非 高 置信 和 度 区 域 采样 的 提议 分 布 。 基 于 这 个 定义 ， 
用 于 SAMC 采样 的 提议 分 布 定义 为 


Qa”) = Aerie”). (4, 7) 
n 


i=1 


这 一 提议 分 布 兼顾 了 局 部 随机 游 走 和 全 局 的 随机 跳跃 。 同 时 , 它 偏 置 采样 到 高 置 
信和 度 区 域 来 提高 采样 效率 。 值 得 注意 的 是 ,这 个 提议 分 布 也 能 在 非 高 置信 度 区 域 
产生 有 限 数量 的 候选 样本 ,帮助 采样 避免 陷入 局 部 模式 。 
由 式 (4.7) 可 以 看 到 ,提议 分 布 是 随 着 采样 不 断 变化 的 。 在 采样 开始 阶段 ,由 
于 高 置信 度 区 域 尚未 被 挖掘 出 来 ,因而 我 们 以 一 个 较 大 的 概率 值 学 习 和 更 新 提议 
分 布 , 随 着 采样 过 程 的 深入 ,学习 到 的 提议 分 布 渐进 地 靠近 “最 佳 ? 提 议 分 布 , 因 而 
对 提议 分 布 的 更 新 就 不 必 像 初始 采样 阶段 那么 频繁 。 我 们 考虑 如 下 的 提议 分 布 更 
新 策略 : 
QP = &Q* +A ENR (4.8) 
RPQ ARTES k UTE RITE E H HENE S QU? 表示 在 人 一 1 次 迭代 时 使 
用 的 提议 分 布 ;& 为 学 习 率 。 此 处 定义 : 
& = (一 Mo 一 之 Mo (4.9) 
式 中 ,7 为 控制 学 习 率 的 下 降 速度 。 


4.3.4 强 自 适 应 的 MCMC 采样 


IA-MCMC 采样 算法 包含 两 个 采样 阶段 , 即 初始 化 阶段 和 自 适应 采样 阶段 。 
初始 采样 阶段 的 任务 是 挖掘 能 量 分 布 的 粗略 模式 (Rough Mode) ,而 自 适应 采样 阶 
段 则 在 样本 空间 中 提炼 高 置信 和 度 区 域 并 指导 采样 达到 或 靠近 全 局 最 佳 模式 。 

在 初始 采样 阶段 ,我 们 采用 固定 不 变 的 转移 核 并 使 用 一 定数 量 的 样本 调用 
SAMC 采样 算法 ,以 获得 样本 空间 中 能 量 分 布 的 粗略 模式 。 基 于 初始 采样 阶段 获 
取 的 样本 集 ,密度 网 格 构建 一 个 初始 的 预测 模型 , 它 把 样本 空间 粗略 地 划分 为 高 置 
信和 度 区 域 和 非 高 置信 和 度 区 域 。 在 自 适应 采样 阶段 ,为 有 效 地 提炼 和 求 精 高 置信 和 度 
区 域 ,我 们 将 该 采样 阶段 继续 划分 为 多 个 小 阶段 。 随 着 采样 的 进行 ,通过 使 用 密度 
网 格 ,高 置信 度 区 域 逐 渐 地 被 压缩 和 提炼 。 特 别 地 ,我们 使 用 一 种 类 似 退 火 (An- 
nealing) 地 方式 压缩 有 和 希望 的 ”区域 , 即 一 旦 采样 进入 一 个 新 的 阶段 ,就 重新 构建 
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一 个 具有 更 高 分 辩 率 的 密度 网 格 ,例如 ,可 以 把 每 个 密 

的 小 单元 并 重新 计算 单元 的 密度 。 整 个 IA-MCMC 采样 过 

IA-MCMC 采样 的 序 贯 贝 叶 斯 滤波 跟踪 算法 描述 如 下 : 
算法 输入 : METR {r2 ew Ps 


算法 输出 : 粒子 集 {z? ew? 1X. West x 


度 单元 切 分 为 等 体积 (面积 ) 
程 如 图 4-4 所 示 。 基 于 


O 


(a) 因 镜头 切换 引起 的 目标 运动 突变 


(c) 初 始 采样 阶段 完成 后 粗略 的 、(d) 随 着 采样 的 进行 ， 
“有 希望 的 ”区 域 (标记 为 “+”) 


(b) 初 始 的 6X 6 密度 网 格 


有 希望 的 ” (e) 最 后 估计 的 目标 状态 
区 域 不 断 地 被 压 Ns 


图 4-4. IA-MCMC 采样 过 程 
CD 初始 化 
-样本 空间 划分 :X= G2, 
- 初始 化 工作 权重 :g;==1,i=1,2,…,m 
— 初始 化 密度 网 格 : s=0;k=0,D(C.k)=0, 


(2) 重 采样 {z 082, ) 六 ,产生 等 权重 粒子 集 { 名 ex]. 
(3) 按照 (3. 18) 式 产生 初始 样本 zf s 
(4) For £—1 to Mo 初始 采样 阶段 : 

— 按 式 (4.2) 抽 取 候 选 样 本 as 

一 按照 式 (3. 20) 计 算 接 受 比 a; 


- 以 概率 a 接受 x ,并 令 x 中 二 x ; 否则 令 eM Srt; 
- 按 式 (3.14) 更 新 工作 权重 ; 
End For 
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(5) For k 二 Mo 十 1 to N // 自 适应 采样 阶段 : 

-车 采样 进入 一 新 的 阶段 , 则 : 
— 使 用 更 高 的 分 辩 率 重建 密度 网 格 ; 
- 更 新 每 个 单元 的 密度 值 ; 
—- ssl; 

- 按 式 (4.8) 抽 取 候 选 样本 x’; 

- 按照 式 (3. 20) 计 算 接受 比 5 

一 以 概率 a 接受 x FES PSr 否则 令 cP Hal”; 

- ERG. 14) 更 新 工作 权重 ; 

-更 新 密度 网 格 的 各 个 单元 密度 值 ; 

End For 
(6) 粒子 加 权 : 

— 按 式 (3. 21) 对 样本 集 加 权 ; 

- 归 一 化 粒子 集 ; 

(7) 基于 粒子 集 估 计 目 标 状 态 To 

事实 上 ,IA-MCMC 算法 是 一 个 嵌入 数据 挖掘 模式 的 自 适应 采样 方法 。 我 们 
在 采样 过 程 中 使 用 这 样 一 个 密度 网 格 模型 辅助 学 习 提议 分 布 ,很 大 一 方面 在 于 其 
高 效 和 易于 实现 ,只 需 极 低 的 计算 代价 。 由 于 该 预测 模型 在 自 适应 采样 过 程 中 被 
频繁 地 使 用 ,因而 使 用 一 个 高 效 的 预测 模型 是 必要 的 。 我 们 也 考虑 了 其 他 一 些 具 
有 更 强 预测 性 能 的 数据 挖掘 模型 ,如 常用 的 CART 模型 9 。 然 而 ,在 我 们 的 视觉 
跟踪 应 用 中 使 用 这 些 分 类 与 预测 模型 需要 耗费 更 高 的 计算 资源 。 

最 后 需要 指出 的 是 ,我 们 提出 的 IA 一 MCMC 算法 理论 上 属于 适应 的 MCMC 
(A-MCMC) 采 样 算法 的 范畴 中 ,因而 除了 必须 遵从 SAMC 采样 算法 收敛 性 条 
件 外 ,还 需 满足 渐 减 自 适应 条 件 , 确 保 采样 算法 的 各 态 历 经 性 。 按 照 自 适应 MC- 
MC 算法 的 收 伊 条 件 %'! 中 易于 验证 本 章 提出 的 A-MCMC 算法 的 各 态 历经 性 。 


4.3.5 实现 细节 


本 节 讨 论 IA-MCMC 算法 应 用 于 运动 突变 的 视觉 跟踪 的 实现 细节 。 为 简化 表 
述 , 本 书 第 3 章 提 出 的 SSAMC 跟踪 算法 称 为 SAMC 跟踪 算法 ,本 章 提 出 的 基于 
IA-MCMC 采样 的 跟踪 算法 称 为 IA-MCMC 跟踪 算法 。 与 SAMC 跟踪 算法 类 似 ， 
目标 状态 表示 为 x 二 {u,v,s), 同样 使 用 基于 颜色 直方 图 的 外 观 模 型 。 由 于 面向 运 
动 突变 的 视觉 跟踪 任务 ,我们 定义 一 个 更 弱 的 运动 模型 : 
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UN) for object position 
p; | ea) = (4. 10) 
edem for object scale 
A UCN) E SUE HE S BUYS 上 的 均匀 分 布 ;M(m :ao ) 为 均值 为 六 一 az 
Harri WHA oi 的 高 斯 分 布 , 其 中 al ,as 为 常 加 速度 AR2 模型 。 在 实际 应 用 
中 ,使 用 这 样 一 个 弱 运 动 先 验 是 合适 的 ,由 于 运动 突变 的 目标 可 能 在 场景 中 的 任何 
位 置 出 现 ,而 目标 的 尺度 变化 则 可 以 近似 地 认为 是 缓慢 (光滑 ) 地 变化 。 类 伏地 ,对 
于 提议 分 布 中 的 尺度 维 ,也 可 采用 这 种 光滑 性 假设 。 
样本 空间 的 划分 方式 与 SAMC 跟踪 算法 中 的 设置 方式 一 致 ,期 望 采样 分 布 也 设 
定 为 均匀 分 布 。 由 于 自 适 应 采样 阶段 已 经 将 采样 偏 置 到 高 置信 和 度 区 域 ,因而 不 必要 
设置 偏 置 的 期 望 采 样 分 布 。 此 外 ,密度 网 格 的 初始 分 辩 率 设 为 6X6。) 王 0.2, 使 初始 
采样 阶段 更 偏向 于 全 局 随机 跳跃 ,以 便于 快速 地 探索 样本 空间 的 能 量 分 布 的 粗鲁 模 
式 。B 二 0.9, 使 提议 分 布 基本 集中 在 高 置信 和 度 区 域 采样 ,以 提高 采样 效率 。 


€ 44 实验 结果 参 


为 了 全 面 评估 TA-MCMC 跟踪 算法 的 性 能 ,我 们 收集 了 十 几 个 涉及 各 种 突变 
运动 场景 的 测试 视频 。 未 经 优化 ,IA-MCMC 跟踪 算法 (300 个 粒子 ) 在 主 频 为 2.8 
GHz 的 PC 上 获得 大 约 20 f/ps 的 帧 率 。 鉴 于 算法 运行 环境 的 差异 ,对 不 同 跟踪 算 
法 在 运行 速度 和 计算 代价 方面 的 比较 ,考察 算法 所 使 用 的 粒子 数目 (样本 数目 或 迭 
代 次 数 ) 更 为 客观 和 公平 ,因为 本 章 参 与 性 能 比较 的 跟踪 算法 的 计算 代价 主要 耗费 
在 迭代 的 似 然 计算 上 。 

在 实验 中 ,我 们 首先 比较 本 书 提出 的 SAMC 和 IA-MCMC 两 种 跟踪 算法 。 通 
过 定性 和 定量 的 比较 ,考察 提议 分 布 自 适应 能 够 对 跟踪 算法 的 性 能 带 来 什么 样 的 
影响 。 然 后 ,我 们 将 IA-MCMC 与 另外 三 种 基于 MCMC 采样 的 跟踪 算法 进行 定性 
和 定量 地 比较 ,这 三 种 基于 MCMC 采样 的 跟踪 算法 分 别 是 : MCMC-PFP? A- 
WLMCP"? 和 基于 AM 采样 65 的 跟踪 算法 。 为 公平 比较 ,所 有 跟踪 算法 采用 相同 
的 运动 先 验 和 观测 似 然 模 型 。 


4.4.1 提议 分 布 自 适应 的 影 


我 们 首先 测试 SAMC 和 IA-MCMC 在 视频 Squash 上 的 跟踪 性 能 。 该 视频 是 
从 一 个 超过 400 帧 的 壁球 比赛 视频 中 按 每 15 帧 抽取 1 帧 的 方式 生成 的 低 帧 率 视 
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频 。 如 图 4-5 所 示 ,使 用 300 个 粒子 IA-MCMC 能 够 成 功 地 估计 目标 的 极 大 不 确 
定性 运动 ,而 使 用 相同 粒子 数 的 SAMC 却 在 一 些 帧 中 没 能 有 效 地 估计 到 目标 的 突 
变 运动 。 为 揭示 提议 分 布 自 适应 能 给 SAMC 采样 效率 带 来 多 大 程度 的 提高 ,我们 
在 视频 Squash 和 Pingpong 上 定量 地 评估 它们 的 跟踪 精确 度 。 如 图 4-6 所 示 , 使 
用 相同 数目 的 粒子 ,IA-MCMC 获得 更 高 的 跟踪 精确 度 和 成 功率 。 这 种 跟踪 性 能 
的 提高 主要 归功 于 IA-MCMC 在 采样 过 程 中 通过 提议 分 布 自 适应 使 采样 偏 置 于 高 
置信 度 区 域 ,从 而 提高 整个 采样 效率 。 


(b)IA-MCMC(300 粒 子 ) 


图 4-5 SAMC fll IA-MCMC 算法 在 视频 Squash. 上 的 部 分 跟踪 结果 。 
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(a) 在 视频 Squash 上 的 跟踪 精确 度 比较 (b) 在 视频 PingPong 上 的 跟踪 精确 度 比较 
图 4-6 SAMC 和 IA-MCMC 算法 在 视频 Squash 和 Pingpong 上 的 跟踪 精确 度 比较 


4.4.2 定性 比较 


为 评估 IA-MCMC 跟踪 算法 的 性 能 ,我 们 在 涉及 多 种 运动 突变 (包括 目标 快速 
移动 .目标 动力 学 突变 、 镜 头 切换 以 及 低 帧 率 视 频 ) 的 多 个 视频 序列 上 与 其 他 三 种 
基于 MCMC 采样 的 跟踪 算法 进行 定性 地 比较 。 
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1. 目标 快速 移动 

我 们 首先 在 Face WA 上 定性 评估 四 种 跟踪 算法 的 跟踪 性 能 。 在 该 视频 
中 ,被 跟踪 的 人 脸 快 速 地 左右 移动 。MCMC-PF 和 AM 算法 使 用 50 个 粒子 ,人 A- 
WLMC 和 IA-MCMC 使 用 25 个 粒子 ,部 分 跟踪 结果 如 图 4-7 所 示 。 从 中 我 们 可 
以 看 到 ,仅仅 使 用 少量 的 粒子 ,A-WLMC 和 IA-MCMC 能 够 有 效 地 跟踪 到 快速 移 
动 的 目标 ,而 MCMC-PF 和 AM 尽管 使 用 了 2 倍 的 粒子 ,但 仍然 频繁 地 出 现 跟踪 
失败 。 

2. 镜头 切换 

视频 场景 中 摄像 机 镜头 切换 往往 导致 目标 的 突变 运动 。 我 们 在 YoungKi 
视频 上 定性 评估 四 种 跟踪 算法 的 性 能 。 在 这 个 视频 中 ,除了 当 镜 头 切 换 时 目 
标 运 动 连续 性 被 破坏 外 ,被 跟踪 的 行人 大 部 分 时 间 段 内 运动 都 是 近似 连续 的 。 
当 发 生 镜头 切换 时 ,目标 在 前 后 帧 之 间 的 关联 信息 几 近 丢失 。 实 验 表 明 , 仅 使 
用 100 个 粒子 ,IA-MCMC fil A-WLMC 能 够 有 效 地 跟踪 到 因 镜 头 切换 导致 的 
运动 突变 的 目标 ,部 分 跟踪 结果 如 图 4-8 所 示 。 Mid 使 用 1 000 个 粒子 ， 
MCMC-PF 和 AM 仍然 不 能 有 效 地 估计 到 目标 的 突变 运动 , 当 镜 头 切 换 发 生 
时 往往 导致 目标 跟踪 的 失败 。 其 主要 原因 在 于 MCMC-PF 和 AM 缺乏 有 效 的 
机 制 避 免 采 样 陷 入 局 部 模式 。 对 于 YoungKi 视频 ,A-WLMC 算法 能 够 有 效 地 
处 理 因 镜 头 切换 引起 的 运动 突变 ,但 同时 我 们 也 看 到 在 跟踪 精确 度 方面 ,使 用 
相同 的 粒子 数 ,IA-MCMC 比 A-WLMC 获得 更 高 的 跟踪 精确 度 , 如 图 4-8(c) 和 
4-8(d) 所 示 。 


(a)MCMC_ PF (b)AM 
#19 #4 #19 #25 
(OA WLMC (d)IA MCMC 


图 4-7 四 种 不 同 跟踪 算法 在 视频 Face 上 的 部 分 跟踪 结果 。A-WLMC 和 IA-MCMC 
使 用 25 个 粒子 ,MCMC-PF 和 AM 使 用 50 个 粒子 。 
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(d)IA MCMC 


图 4-8 四 种 不 同 算法 在 视频 YoungKi 上 的 部 分 跟踪 结果 。MCMC-PF 
和 AM 使 用 1 000 个 粒子 ,A-WLMC 和 IA-MCMC 使 用 100 个 粒子 。 


3. 动力 学 突变 

我 们 在 Pingpong 视频 上 测试 四 种 不 同 算法 在 目标 动力 学 发 生 突 变 情况 下 的 
跟踪 性 能 。 当 乒乓 球 在 下 落 碰 到 球拍 后 反弹 ,这 一 碰撞 前 后 目标 的 动力 学 特征 发 
生 突然 改变 。 这 种 难以 预测 的 目标 动力 学 特征 使 跟踪 任务 变 得 相当 困难 。 我 们 的 
实验 表明 ,使 用 300 个 粒子 IA-MCMC 能 够 有 效 地 在 整个 序列 中 跟踪 到 乒乓 球 的 
不 确定 性 运动 ,部 分 跟踪 结果 如 图 4-9 所 示 。 值 得 注意 的 是 ,该 视频 场景 中 目标 的 
尺寸 远 小 于 前 一 个 实验 中 YoungKi 视频 的 行人 。 因 而 ,样本 空间 中 “有 和 希望 的 ”区 
域 相 对 的 小 得 多 ,这 意味 着 需要 更 多 的 粒子 去 挖掘 “有 和 希望 的 ”区域 以 提高 采样 效 
率 。 另 一 方面 ,即使 使 用 1 000 个 粒子 ,MCMC-PF 和 AM 算法 在 这 个 测试 视频 中 
仍然 表现 较 差 ,频繁 出 现 目标 漂移 和 跟踪 失败 。 此 外 ,同样 使 用 300 个 粒子 ,A- 
WLMC 算法 在 该 视频 的 一 些 帧 中 (例如 #50, #68,#89) 存 在 跟踪 失败 现象 。 

4. 低 帧 率 视频 

这 个 实验 的 任务 是 在 一 段 低 帧 率 的 网 球 比赛 视频 Tennis 中 跟踪 一 个 具有 极 
大 不 确定 性 运动 特征 的 网 球 选手 。 该 视频 是 从 一 段 超过 700 帧 的 原始 比赛 视频 经 
过 每 20 帧 抽取 1 帧 生成 的 低 帧 率 视频 。 我 们 评估 了 四 种 跟踪 算法 在 这 个 视频 序 
列 上 的 跟踪 性 能 ,部 分 跟踪 结果 如 图 4-10 所 示 。 从 图 4-10 可 以 看 到 ,由 于 严重 的 
ij (Frame Dropping) ,即使 使 用 1 000 个 粒子 ,MCMC-PF 和 AM 仍然 频繁 地 出 
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视觉 跟踪 中 的 马 氏 链 蒙特 卡 洛 方法 


ALT E. X. 


#80 #98 
(a)MCMC-PF (b)AM 
448 #50 #57 #60 #68 #89 
(c)A-WLMC 
#48 #50 457 #60 #68 #89 
(d)IA-MCMC 


图 4-9 四 种 不 同 算法 在 Pingpong 视频 上 的 部 分 跟踪 结果 。MCMC-PF 和 AM 使 用 1 000 个 
粒子 ,A-WLMC 和 IA-MCMC 使 用 300 个 粒子 。 

现 跟踪 漂移 和 失败 。 而 仅 使 用 了 300 个 粒子 ,IA-MCMC 能 够 有 效 地 跟踪 到 目标 
的 极 大 不 确定 性 。 另 一 方面 ,同样 使 用 300 个 粒子 , A-WLMC 在 一 些 帧 中 无 法 有 
效 地 估计 目标 的 突变 运动 (例如 #26, #33)。 

5. 镜头 切换 十 低 帧 率 视频 

在 这 个 实验 中 ,我 们 定性 地 评估 四 种 不 同 算法 在 一 个 编辑 合成 的 视频 Walk 
上 的 跟踪 性 能 。 在 该 合成 视频 的 场景 中 ,目标 存在 很 严重 的 突变 运动 , 它 涉及 两 种 
类 型 的 突变 运动 , 即 镜头 切换 和 低 帧 率 视 频 。 该 视频 由 三 段 不 同 视角 拍摄 的 低 帧 
率 视频 编辑 合成 的 。 此 外 ,场景 中 多 个 行人 来 回 走动 ,频繁 地 互相 遮挡 。 部 分 跟踪 
结果 如 图 4-11 所 示 。 从 图 4-11 中 可 以 看 到 ,使 用 300 个 粒子 ,除了 极 少数 帧 ( 当 目 
标 几乎 被 其 他 目标 完全 遮挡 时 ,例如 #100),IA-MCMC 能 在 整个 视频 中 实现 有 效 
地 目标 跟踪 。 同 时 我 们 可 以 看 到 ,同样 使 用 300 个 粒子 ,A-WLMC 在 相当 数量 的 
视频 帧 中 ( 当 目 标 靠近 或 局 部 遮挡 发 生 时 ) 都 出 现 跟踪 失败 的 情况 。 另 一 方面 , 即 
便 使 用 600 个 粒子 ,由 于 目标 存在 严重 的 运动 不 确定 性 ,MCMC-PF 和 AM 算法 频 
繁 地 出 现 了 跟踪 漂移 和 失败 。 
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#26 
(c)A-WLMC 


#26 #27 

(d)IA-MCMC 
图 4-10 四 种 不 同 跟 踪 算 法 在 Tennis 视频 上 的 部 分 跟踪 结果 。MCMC-PF 和 AM 使 用 
1000 个 粒子 ,A-WLMC 和 IA-MCMC 使 用 300 个 粒子 。 


4.4.3 定量 比较 


为 量化 地 评估 TA-MCMC 跟踪 算法 的 性 能 ,我 们 在 多 个 测试 视频 上 与 其 他 三 
种 跟踪 算法 进行 了 定量 的 比较 。 我 们 首先 定义 跟踪 失败 , 当 估 计 的 目标 中 心 不 在 
基准 目标 矩形 (人 为 标注 的 ) 内 时 ,就 认为 是 跟踪 失败 。 确 切 地 说 ,在 每 一 帧 中 只 有 
当 召 回 率 (Recall) 和 准确 率 (Precision) 都 高 于 50% 时 , 才 认 为 该 帧 的 目标 跟踪 是 
成 功 的 。 

表 4-1 所 示 为 四 种 不 同 跟踪 算法 在 测试 视频 上 的 跟踪 成 功率 。 从 表 4-1 中 可 
以 看 到 ,即便 使 用 1000 个 粒子 ,MCMC-PF 和 AM 在 这 些 存 在 突变 运动 的 测试 视 
频 上 表现 出 较 差 的 跟踪 性 能 ,相对 来 说 AM 要 稍 好 一 些 , 这 主要 归功 于 其 自 适应 的 
采样 机 制 。 然 而 由 于 缺乏 能 够 避免 采样 陷入 局 部 模式 的 有 效 机 制 ,这 两 种 算法 在 
跟踪 突变 运动 的 目标 时 存在 很 大 的 困难 。 相 比 MCMC-PF 和 AM 算法 ,A-WLMC 
fll IA-MCMC 在 使 用 较 少 粒子 的 情况 下 仍然 在 测试 视频 上 获得 了 较 高 的 跟踪 成 功 
率 。 此 外 ,IA-MCMC 算法 的 跟踪 成 功率 较 之 A-WLMC 高 出 近 9 个 百分点 ,而 仅 
仅 使 用 了 其 一 半数 量 的 粒子 。 
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C) 视觉 跟踪 中 的 马 氏 链 蒙特 卡 洛 方法 


#162 #407 #495 


#407 #443 
(d)IA-MCMC 


#93 #100 


四 种 不 同 算法 在 Walk 视频 上 的 部 分 跟踪 结果 。MCMC-PF 和 AM 使 用 600 个 粒子 ， 


图 4-11 
A-WLMC fil IA-MCMC 使 用 300 个 粒子 。 
表 4-1 四 种 不 同 跟踪 算法 在 测试 视频 上 的 跟踪 成 功率 
方法 粒子 数 跟踪 成 功率 (%) 方法 粒子 数 跟踪 成 功率 (%) 
MCMC-PF 1000 68.3 A-WLMC 600 87.4 
AM 1000 74.1 IA-MCMC 300 96.1 


此 外 ,我 们 比较 了 四 种 算法 在 测试 视频 上 的 估计 位 置 错 误 。 图 4-12 所 示 为 不 
同 跟踪 算法 在 两 个 测试 视频 上 的 逐 帧 位 置 错误 比较 ,而 相对 位 置 错 误 (RPE) 的 统 
计 见 表 4-2。 从 表 4-2 中 可 以 看 到 ,无 论 是 位 置 错误 均值 还 是 标准 差 ,我 们 提出 的 
IA-MCMC 算法 都 明显 小 于 其 他 三 种 算法 。 这 表明 了 我 们 的 算法 在 处 理 突变 运动 


时 能 够 获得 更 准确 和 稳定 的 跟踪 性 能 。 
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第 4 章 运动 突变 的 视觉 跟踪 方法 


最 后 ,我们 评估 四 种 不 同 的 跟踪 算法 在 对 低 帧 率 视频 跟踪 时 受 帧 率 的 影响 情 
况 。 我 们 选择 了 一 组 低 帧 率 视频 :Tennis(10),Tennis(15),Tennis(20), Tennis 
(30) ,Tennis(35)。 它 们 是 由 一 段 超 过 700 帧 的 视频 中 按 每 10 一 35 帧 抽取 1 帧 生 
成 的 低 帧 率 视频 序列 。 图 4-13 所 示 为 四 种 不 同 跟踪 算法 在 这 个 低 帧 率 序 列 上 跟 
踪 成 功率 受 帧 率 的 影响 。 从 图 4-13 中 可 以 看 到 ,即使 使 用 少量 的 粒子 ,IA-MCMC 
算法 的 跟踪 性 能 明显 优 于 其 他 三 种 算法 。 此 外 ,IA-MCMC 和 A-WLMC 的 跟踪 性 
能 受 帧 率 的 影响 较 小 。 而 MCMC-PF 和 AM 对 帧 率 变化 较为 敏感 , 随 着 帧 率 的 下 
降 其 跟踪 性 能 也 显著 下 降 。 


50 T T T rj 200 T T T 
= - - MCMC-PF (50) —— IA-MCMC (300) 
"I - - - AM(50) A-WLMC(300) 
E A-WLMC(25) || ~150H - - - AM(1 000) 1 
w IA-MCMC 25) || 3€ - - - MCMC-PF(1 000) : ^ 
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4.4.4 


图 4-12 不 同 跟踪 算法 在 四 个 测试 视频 上 的 跟踪 精度 比较 。 


讨论 


以 上 实验 验证 了 本 章 提 出 的 IA-MCMC 跟踪 算法 的 有 效 性 。 当 目标 运动 发 生 
突变 时 ,我 们 能 够 解释 MCMC-PF 和 AM 两 种 跟踪 算法 表现 欠 佳 的 主要 原因 , 那 
就 是 它们 缺乏 避免 采样 陷入 局 部 模式 的 有 效 机 制 即便 使 用 大 量 的 粒子 ,它们 也 易 
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| ) 视觉 跟踪 中 的 马 氏 链 蒙特 卡 洛 方法 


于 导致 跟踪 失败 。 另 一 方面 ,虽然 A 一 WLMC 算法 具有 处 理 突 变 运动 的 能 力 ,但 
是 它 仍 然 需要 相当 数量 的 粒子 实现 在 庞大 的 样本 空间 中 进行 充分 的 采样 。 不 同 于 
别 的 跟踪 算法 ,IA-MCMC 利用 马 氏 链 上 的 样本 信息 进行 深度 自 适应 的 MCMC R 
样 ,其 中 目标 分 布 自 适应 用 于 避免 采样 陷入 局 部 模式 ,而 提议 分 布 自 适应 则 力图 通 
过 学 习 “ 最 优 的 ”提议 分 布 来 提高 整体 采样 效率 。IA-MCMC 可 以 看 作 一 个 嵌入 数 
据 挖掘 模式 的 “采样 一 预测 一 采样 ”过程 , 它 指导 MCMC 采样 迅速 地 靠近 或 达到 滤 
波 分 布 的 高 置信 度 区 域 ,从 而 实现 有 效 地 处 理 目标 的 突变 运动 。 
表 4-2 不 同 跟 踪 算法 在 测试 视频 上 的 相对 位 置 错误 (RPE) 


Face Pingpong Tennis(35) Walk 
跟踪 算法 


Al 
a 


d d, d d, 


AI 
a 


MCMC-PF 0. 5997 0. 4887 1. 5571 1. 3633 2.0175 1. 7516 1. 2710 2.0469 


AM 0. 3896 0. 3589 1. 1502 1. 8803 1. 3132 2.0012 0.9732 1.9215 


A-WLMC 0. 2234 0. 1197 1. 8041 2. 7661 0. 4867 0. 8858 0. 4575 1. 0337 


IA-MCMC 0. 1706 0. 1024 0. 1396 0. 0821 0.1716 0.1256 0. 3316 0. 7847 


€» 4.5 小 结合 


本 章 提 出 了 IA-MCMC 采样 算法 实现 运动 突变 的 视觉 跟踪 任务 。IA — MC- 
MC 跟踪 算法 的 关键 环节 是 在 SSAMC 跟踪 框架 下 在 线 学 习 和 估计 “最 优 的 ”提议 
分 布 。 为 此 ,构建 了 一 个 基于 密度 网 格 的 预测 模型 并 将 其 嵌入 到 MCMC 采样 过 程 
中 ,实现 一 个 “采样 一 预测 一 采样 ”的 过 程 。 这 种 嵌入 数据 挖 握 模式 的 MCMC 采样 
算法 能 够 显著 地 提高 采样 效率 。IA-MCMC 算法 能 够 有 效 地 处 理 多 种 运动 突变 的 
视觉 跟踪 问题 ,包括 目标 的 快速 运动 .目标 动力 学 特征 突变 、 低 帧 率 视 频 以 及 综合 
多 种 运动 突变 的 视频 。 全 面 的 实验 评估 表明 了 与 同类 的 主流 跟踪 算法 相 比 它 能 获 
得 更 好 的 跟踪 性 能 。 

需要 指出 的 是 ,本 章 主 要 关注 运动 突变 的 视觉 跟踪 问题 , 仅 采 用 了 一 个 简单 的 
外 观 模型 ,并 未 考虑 目标 外 观 模型 的 自 适应 策略 。 即 便 如 此 ,由 于 本 章 提出 的 跟踪 
算法 是 一 个 较为 通用 的 跟踪 方法 , 它 易于 集成 更 为 有 效 的 目标 表示 和 可 靠 的 外 观 
模型 (如 判别 外 观 模型 ”外 ) 以 进一步 提高 算法 在 复杂 场景 中 的 跟踪 性 能 。 
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视觉 跟踪 是 计算 机 视觉 研究 的 一 个 基本 和 关键 的 环节 ,长 期 以 来 它 得 到 了 广 
泛 和 深入 的 研究 。 近 年 来 , 随 着 相关 学 科 领 域 理论 和 技术 的 发 展 ,视觉 跟踪 研究 在 
理论 方法 和 实现 技术 方面 得 到 了 进一步 的 深入 和 发 展 ,并 且 在 智能 交通 、 人 机 交 
互 、 视 频 监控 和 军事 等 领域 得 到 了 更 为 广泛 的 应 用 。 在 实际 应 用 中 ,视觉 跟踪 方法 
通常 需要 处 理 一 些 复杂 的 情况 ,包括 如 何 建 模 目 标的 运动 变化 ,以 有 效 地 捕获 目标 
运动 的 不 确定 性 ;如 何 设计 有 效 的 外 观 模 型 以 适应 外 观 的 显著 变化 ;如 何 设计 稳健 
高 效 的 视觉 跟踪 算法 以 满足 实际 的 目标 跟踪 任务 ;等 等 。 运 动 极 大 不 确定 性 条 件 
下 的 目标 跟踪 是 视觉 跟踪 的 一 个 难点 ,基于 运动 连续 性 假设 的 传统 贝 叶 斯 滤波 跟 
踪 方 法 在 解决 这 一 问题 时 具有 很 大 的 局 限 性 。 本 书 主要 研究 了 自 适应 马 氏 链 蒙 特 
卡 洛 采样 的 理论 方法 和 实现 技术 ,以 及 在 目标 运动 极 大 不 确定 性 条 件 下 的 视觉 跟 
踪 方 法 。 具 体 地 : 

(1) 研究 了 传统 的 MCMC 采样 算法 在 高 维 状态 空间 中 采样 时 表现 出 混合 性 
较 差 且 易 于 陷入 局 部 模式 的 基本 原因 ;研究 了 当前 主要 的 三 类 A-MCMC 采样 算 
法 , 即 再 生 马 氏 链 、 提 议 分 布 自 适应 以 及 目标 分 布 自 适应 ;探讨 了 MCMC 采样 算法 
在 计算 机 视觉 中 的 应 用 ,给 出 了 一 种 结合 局 部 优化 与 全 局 蒙特 卡 洛 采 样 的 目标 轮 
廓 近似 表示 算法 。 实 验 表明 ,与 同类 的 主流 多 边 形 近似 算法 相 比 ,本 书 研究 的 近似 
算法 能 取得 更 高 的 近似 精度 代价 比 。 

(2) 研究 了 基于 SMC 采样 和 基于 MCMC 采样 的 视觉 跟踪 算法 的 局 限 性 ,将 
随机 通 近 蒙特 卡 洛 (SAMC) 采 样 方法 引入 到 贝 叶 斯 滤波 跟踪 框架 ,给 出 了 一 种 序 
贯 随机 逼近 蒙特 卡 洛 (Sequential SAMC) 跟 踪 算法 , 它 是 一 个 动态 加 权 的 重要 性 采 
样 算法 ,能 够 有 效 避 免 粒子 采样 陷入 局 部 模式 。 该 算法 是 一 个 通用 的 视觉 跟踪 框 
架 , 易 于 集成 不 同 的 观测 模型 .目标 表示 以 及 提议 分 布 ,实现 更 为 稳健 的 视觉 跟踪 。 
与 同类 的 基于 随机 采样 视觉 跟踪 框架 (如 Bootstrap PF, MCMC-PF) 相 比 ,本 书 研 
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究 的 Sequential SAMC 跟踪 框架 能 够 更 为 有 效 地 处 理 复杂 的 贝 叶 斯 滤波 跟踪 问 
题 ,同时 还 保持 了 同类 跟踪 框架 所 具有 的 可 扩展 性 。 

(3) 针对 运动 突变 情况 下 的 视觉 跟踪 问题 ,本 书 研究 了 一 种 强 自 适应 的 MC- 
MC(IA-MCMC) 采 样 算法 实现 对 复杂 滤波 分 布 的 有 效 采 样 。 它 通过 引入 一 个 基 
于 密度 网 格 的 在 线 数据 挖掘 模型 到 SAMC 采样 过 程 中 ,利用 自 适应 马 氏 链 上 的 历 
史 样 本 信息 , 自 适 应 地 更 新 马尔 科 夫 转移 核 。 它 通过 两 个 相互 协作 的 在 线 学 习 过 
程 实现 深度 自 适应 的 蒙特 卡 洛 采样 ,其 中 一 个 学 习 过 程 通过 在 线 估计 态 密度 来 通 
近 目 标 分 布 , 另 一 个 学 习 过 程 通 过 预测 模型 估计 最 佳 的 提议 分 布 ;该 方法 通过 在 能 
量 空间 的 随机 游 走 有 效 地 避免 采样 陷入 局 部 模式 ,同时 能 够 通过 自 适应 的 采样 机 
制 加 速 收敛 ;实验 表明 ,该 算法 在 采样 效率 和 跟踪 性 能 方面 明显 地 优 于 同类 算法 ， 
并 能 够 在 多 种 复杂 运动 场景 下 (目标 快速 运动 .目标 动力 学 突变 、 镜 头 切换 和 低 帧 
率 视频 ) 实 现 快速 有 效 的 目标 跟踪 。 

复杂 场景 下 的 视觉 跟踪 是 计算 机 视觉 研究 领域 中 一 项 困难 的 和 充满 挑战 的 研 
究 方 向 。 长 期 以 来 ,国内 外 的 学 者 对 视觉 跟踪 进行 了 不 懈 地 探索 和 研究 ,并 取得 了 
许多 重要 的 理论 成 果 和 可 靠 实用 的 实践 技术 。 即 便 如 此 ,如 何在 复杂 条 件 下 实现 
稳健 的 视觉 跟踪 仍然 是 个 极 具 挑 战 的 研究 课题 ,当前 的 视觉 跟踪 技术 离 实际 应 用 
需求 还 有 相当 大 的 距离 。 本 书 是 在 前 人 研究 工作 的 基础 上 ,对 视觉 跟踪 领域 中 的 
一 些 关 键 问 题 进行 了 一 些 探索 和 研究 .取得 了 一 些 研 究 成 果 。 需 要 指出 的 ,本 书 主 
要 关注 目标 运动 极 大 不 确定 性 情况 下 的 视觉 跟踪 问题 ,因而 没有 讨论 目标 外 观 的 
自 适 应 。 作 者 相信 ,当前 成 熟 的 外 观 模型 (原生 模型 或 判别 模型 ) 可 以 较为 容易 地 
集成 到 提出 的 跟踪 框架 中 ,以 进一步 提高 跟踪 算法 的 稳健 性 。 

此 外 , 自 适 应 MCMC 采样 方法 在 最 近 几 年 取得 了 重要 的 理论 进展 ,但 该 领域 
的 理论 研究 和 实现 技术 还 有 待 进一步 、 深 入 地 研究 和 探索 。 尽 管 如 此 , 自 适应 MC- 
MC 采样 方法 已 经 在 一 些 科学 计算 领域 展示 了 其 优越 性 。 本 书 将 其 引入 到 视觉 跟 
踪 领 域 ,做 了 一 些 有 益 的 探索 和 研究 ,相信 和 随 着 自 适应 MCMC 采样 理论 研究 的 进 
一 步 深入 与 发 展 ,将 会 进一步 促进 它 在 视觉 跟踪 研究 乃至 计算 机 视觉 研究 中 的 
应 用 。 


90 


参考 文献 


[1] Hate. 机 器 视觉 LMJ. 北京 :科学 出 版 社 ,2000. 

[2] 修志 强 , 埋 崇 昭 . 视觉 跟踪 技术 综述 . 自动 化 学 报 [J]. 2006, 4(32)，pp: 603- 
617. 

[3] W. Hu. T. Tan. L. Wang. S. Maybank. A survey on visual surveillance of 
object motion and behaviors. IEEE Trans. on SMC-C: Applications and Re- 
views [J]. 2004. 34(3). 334-352. 

[4] M. Isard, A. Blake. CONDENSATION; Conditional density propagation for 
visual tracking. IJCV [J]. 1998. 29(1); 5-28. 

[5] Z. Khan, T. Balch, F. Dellaert. An mcemc-based particle filter for tracking 

multiple interacting targets. ECCV [C]. 2004, 279-90. 

[6] A. Yilmaz. O. Javed. M. Shah. Object tracking: A survey. ACM Compu- 

ting Surveys [J]. 2006. 38(4). 

[7] C. J. Veenman, M. J. T. Reinders, E. Backer. Resolving motion corre- 

spondence for densely mo- ving points. IEEE Trans. on PAMI [J]. 2001. 23 

(1), 54-72. 

[8] D. Serby. E. K. Meier, L. V. Gool. Probabilistic object tracking using 

multiple features. ICPR [C]. 2004, 184-187. 

[9] D. Comaniciu. V. Ramesh. P. Meer. Kernel-based object tracking. IEEE 
Trans. on PAMI [J]. 2003. 25(5) . 564-577. 

[10] A. Yilmaz. X. Li. M. Shah. Contour-based object tracking with occlusion 


handling in video acquired using mobile cameras. IEEE Trans. on PAMI 
[J]. 2004, 26(11), 1531-1536. 

[11] T. F. Cootes, G. J. Edwards, C. J. Taylor. Active appearance models. 
IEEE Trans. on PAMI [J]. 2001. 23(6), 681-685. 

[12] J. Canny. A computational approach to edge detection. IEEE Trans. on 
PAMI [J]. 1986. 8(6). 679-698. 


91 


) 视觉 跟踪 中 的 马 氏 链 蒙特 卡 洛 方法 


[13] G. Hua. Y. Wu. Multi-scale visual tracking by sequential belief propaga- 

tion. CVPR [C]. 2004, 826-833. 

[14] B. D. Lucas. T. Kanade. An iterative image registration technique with an 

application to stereo vision. IJCAI [C]. 1981. 674-679. 

[15] B. K. P. Horn, B. G. Schunck. Determining optical flow. Artificial Intel- 

ligence [J]. 1981. 17(1), 185-203. 

[16] N. Dalal. B. Triggs. Histograms of oriented gradients for human detec- 

tion. CVPR [C]. 2005, 886-893. 

[17] T. Ahonen, A. Hadid. M. Pietikinen. Face recognition with local binary 
patterns. ECCV [C], 2004, 469-481. 


[18] D. G. Lowe. Distinctive image features from scale-invariant keypoints. 
IJCV [J]. 2004. vol. 60, 91 - 110. 

[19] K. Tieu, P. Viola. Boosting image retrieval. IJCV [J]. 2004. 56 (1), 
17-36. 

[20] J. Wang. X. Chen. W. Gao. Online selecting discriminative tracking fea- 
tures using particle filter. CVPR [C]. 2005. vol. 2. 1037-1042. 

[21] P. Fieguth, D. Terzopoulos. Color-based tracking of heads and other mo- 
bile objects at video frame rates. CVPR [C]. 1997. 21-27. 

[22] E. Maggio. A. Cavallaro. Accurate appearance-based Bayesian tracking for 
maneuvering targets. CVIU [J]. 2009. 113(4), 544-555. 

[23] S. C. Zhu. A. Yuille. Region competition: Unifying snakes. region grow- 
ing.and Bayes/MDL for multiband image segmentation, IEEE Trans. on 
PAMI [J]. 1996. 18(9). 884-900. 

[24] S. J. McKenna. Y. Raja. S. Gong. Tracking colour objects using adaptive 
mixture models. IVC [J]. 1999. 17(3). 225-231. 

[25] A. Elgammal. R. Duraiswami, D. Harwood. L. S. Davis. Background and 

foreground modeling using nonparametric kernel density estimation for visu- 

al surveillance. Proceedings of the IEEE [J]. 2002, 90(7). 1151-1163. 

[26] M. J. Black. A. D. Jepson. EigenTracking; Robust matching and tracking 

of articulated objects using a view-based representation. IJCV [J]. 1998. 26 

(1), 63-84. 

[27] S. Avidan. Support vector tracking. IEEE Trans. on PAMI [J]. 2004. 26 

(8). pp: 1064-1072. 


92 


et C 


[28] J. Shi. C. Tomasi. Good features to track. CVPR [C]. 1994. pp: 
593-600. 

[29] S. Baker. I. Matthews. Lucas-Kanade 20 years; A unifying framework. 

IJCV [J]. 2004, 56(3), 221-255. 

[30] I. Matthews. T. Ishikawa, S. Baker. The template update problem. IEEE 

Trans. on PAMI [J]. 2004. 26(6). pp: 810-815. 

[31] G. D. Hager. P. N. Belhumeur. Efficient region tracking with parametric 

models of geometry and illumination. IEEE Trans. on PAMI [J]. 1998, 20 

(10), 1025-1039. 

[32] H. T. Nguyen. A. W. M. Smeulders. Fast occluded object tracking by a 

robust appearance filter. IEEE Trans. on PAMI [J]. 2004. 26 (8). 

1099-1104. 

[33] A. D. Jepson. D. J. Fleet. T. F. El-Maraghi. Robust online appearance 
models for visual tracking. IEEE Trans. on PAMI [J]. 2003. 25(10). 
1296-1311. 

[34] B. Han, L. Davis. On-line density-based appearance modeling for object 
tracking. ICCV [C]. 2005. 1492-1499. 

[35] S. Birchfield. Elliptical head tracking using intensity gradients and color 
histograms. CVPR [C]. 1998. 232-237. 

[36] D. Comaniciu, V. Ramesh, P. Meer. Real-time tracking of non-rigid ob- 
jects using Mean Shift. CVPR [C]. 2000. 142-149. 

[37] R. T. Collins. Mean-shift blob tracking through scale space. CVPR [C]. 
2003, 234- 240. 

[38] P. Pérez. C. Hue. J. Vermaak. M. Gangnet. Color-nased probabilistic 
tracking. ECCV [C]. 2002, 661-675. 

[39] K. Nummiaro. E. Koller-Meier. L. V. Gool. An adaptive color-based par- 

ticle filter. IVC [J]. 2003, 21(1), 99-110. 


[40] F. Porikli, Integral histogram: A fast way to extract histograms in Carte- 
sian spaces, CVPR [C]. 2005. 829-836. 

[41] A. Adam, E. Rivlin, I. Shimshoni. Robust fragments-based tracking using 
the integral histogram. CVPR [C]. 2006. 798-805. 

[42] Z. Zivkovic. B. Krose. An EM-like algorithm for color-histogram-based ob- 
ject tracking. CVPR [C]. 2004. 798-803. 


93 


) 视觉 跟踪 中 的 马 氏 链 蒙特 卡 洛 方法 


[43] G. D. Hager. M. Dewan. C. V. Stewart. Multiple kernel tracking with 
SSD. CVPR [C], 2004. 790-797. 

[44] Z. Fan, Y. Wu. M. Yang. Multiple collaborative kernel tracking. CVPR 
[C]. 2005, 502-509. 

[45] M. Dewan. G. D. Hager. Toward optimal kernel-based tracking. CVPR 
CC], 2006, 618-625. 

[46] Z. Fan. M. Yang. Y. Wu. G. Hua. T. Yu. Efficient optimal kernel 
placement for reliable visual tracking. CVPR [C]. 2006, 658-665. 

[47] D. Ross. J. Lim. M. -H. Yang. Adaptive probabilistic visual tracking with 
incremental subspace update. ECCV [C]. 2004, 470-482. 

[48] X. Li. W. Hu. Z. Zhang. X. Zhang. M. Zhu. J. Cheng. Visual tracking 


via incremental Log- Euclidean Riemannian subspace learning. CVPR 
LC]. 2008. 

[49] Y. Wu. J. Cheng. J. Wang. H. Lu. Real-time visual tracking via incre- 
mental covariance tensor learning. ICCV [C]. 2009, 1631-1638. 

[50] X. Li. W. Hu. Z. Zhang. X. Zhang. Robust visual tracking based on an 
effective appearance model. ECCV [C]. 2008. 396-408. 

[51] R. T. Collins. Y. Liu. On-line selection of discriminative tracking fea- 
tures, ICCV [C]. 2003, 346-352. 

[52] Z. Yin. R. Collins. Spatial divide and conquer with motion cues for track- 
ing through clutter. CVPR [C]. 2006. 570-577. 

[53] J. Wang. X. Chen. W. Gao. Online selecting discriminative tracking fea- 
tures using particle filter. CVPR [C]. 2005. 1037-1042. 

[54] M. Yang. Z. Fan. J. Fan. Y. Wu. Tracking nonstationary visual appear- 
ances by data-driven ada- ptation. IEEE Trans. on Image Processing [J]. 
2009, 18(7), 1633-1644. 

[55] S. Avidan. Ensemble tracking. CVPR [C]. 2005. 494-501. 

[56] H. Grabner, H. Bischof. On-line boosting and vision. CVPR [C]. 2006, 
260-267. 

[57] F. Tang. S. Brennan. Q. Zhao and H. Tao. Co-tracking using semi-super- 
vised support vector machines. ICCV [C], 2007, 1-8. 


94 


et C 


[58] R. Liu. J. Cheng. H. Lu. A robust boosting tracker with minimum error 
bound in a co-training framework. ICCV [C], 2009. 1459-15568. 

[59] T. Woodley. B. Stenger and R. Cipolla. Tracking using online feature se- 
lection and a local genera-tive model. BMVC [C]. 2007. 

[60] H. Grabner. C. Leistner and H. Bischof. Semi-supervised on-line boosting 
for robust tracking. ECCV [C]. 2008. 234-247. 

[61] P. K. Mallapragada. R. Jin. A. K. Jain. Y. Liu. SemiBoost: Boosting for 
semi-supervised learning. IEEE Trans. on PAMI [J], 2009, 31(11). 2000- 
2014. 

[62] B. Babenko, M. -H. Yang and S. Belongie. Visual tracking with online 
multiple instance leaning. CVPR [C]. 2009. 983-990. 


[63] P. Viola. J. C. Platt. C. Zhang. Multiple instance boosting for object de- 
tection. NIPS [C]. 2005. 1417-1426. 

[64] B. Zeisl. C. Leistner, A. Saffari, H. Bischof. On-line semi-supervised 
multiple-instance boos- ting. CVPR[C], 2010, 1879-1886. 

[65] Y. Cheng. Mean Shift. mode seeking. clustering. IEEE Trans. on PAMI 
[LJ]. 1995. 17(8), 790- 799. 

[66] D. Comaniciu. P. Meer. Mean Shift: A robust approach toward feature 
space analysis. IEEE Trans. on PAMI [J]. 2002, 24(5), 603-619. 

[67] M. Fashing. C. Tomasi. Mean shift is a bound optimization. IEEE Trans. 
on PAMI [J]. 2005, 27(3), 471-474. 

[68] C. Shan, T. Tan, Y. Wei. Real-time hand tracking using a Mean Shift em- 

bedded particle filter. Pattern Recognition [J]. 2007. 40(1). 1958-1970. 

[69] C. Shen. M. J. Brooks. A. Hengel. Fast global kernel density mode see- 

king with application to localization and tracking. ICCV [C]. 2005. 

1516-1523. 

[70] R. E. Kalman. A new approach to linear filtering and prediction problems. 

Journal of Basic Engi- neering [J]. 1960. 

[71] M. S. Arulampalam,. S. Maskell. N. Gordon. T. Clapp. A tutorial on 


particle filters for online nonlinear/non-Gaussian Bayesian tracking. IEEE 


Trans. on Signal Processing. 2002, 50(2), 174- 188. 


95 


) 视觉 跟踪 中 的 马 氏 链 蒙特 卡 洛 方法 


[72] A. Doucet. S. Godsill and C. Andrieu. On sequential Monte Carlo sam- 
pling methods for Bayesian filtering. Statistics and Computing [J]. 2000. 
vol. 10, 197-208. 

[73] M. Isard, A. Blake. ICONDENSA TION; Unifying low-level and high-level 
tracking in a stochastic framework. ECCV [C]. 1998. 893-908. 

[74] J. S. Liu. R. Chen. T. Logvinenko. A theoretical framework for sequen 
tial importance sampling and resampling. Sequential Monte Carlo Methods 
in Practice [M]. New York; Springer-Verlag. 2001. 

[75] W. R. Gilks. S. Richardson. D. J. Spiegelhalter. Markov Chain Monte 
Carlo in practice [M]. New York; Chapman and Hall, 1996. 


[76] B. Han. Y. Zhu. D. Comaniciu. L. Davis. Kernel-based Bayesian filtering 
for object tracking. CVPR [C]. 2005. 227-234. 
[77] G. Zhu. D. Liang. Y. Liu. Q. Huang. W. Gao. Improving particle filter 


with support vector regression for efficient visual tracking. ICIP [C]. 
2005, 422-425. 

[78] Y. Wu. J. Fan. Contextual flow. CVPR [C]. 2009. 33-40. 

[79] T. J. Cham. J. M. Rehg. A Multiple hypothesis approach to figure track- 
ing. CVPR [C]. 1999. 239-245. 

[80] J. Vermaak. A. Doucet. P. Perez. Maintaining multi-modality through 
mixture tracking. ICCV [C]. 2003. 1110-1116. 

[81] A. Banerjee. P. Burlina. Efficient particle filtering via sparse kernel density 
estimation, IEEE Trans. on Image Processing [J]. 2010. 19 (9), 
2480-2490. 

[82] J. Weston. Support vector density estimation. Advances in Kernel Methods 
LM]. MIT Press. 1998. 

[83] J. Deutcher. A. Blake. I. Reid. Articulated body motion capture by an- 
nealed particle filtering. CVPR [C]. 2000. 2126-2133. 

[84] K. Choo. D. Fleet. People tracking using hybrid Monte Carlo filtering. IC- 
CV [C], 2001, 321-328. 

[85] T. Zhao. R. Nevatia. Tracking multiple humans in crowded environment. 


CVPR [C]. 2004, 406-413. 


96 


et C 


[86] M. Isard. A. Blake. A Mixed-state condensation tracker with automatic 
model switching. ICCV [C]. 1998, 107-112. 

[87] B. North, A. Blake. Learning dynamical models by expectation maximiza- 
tion. ICCV [C]. 1998, 384-389. 

[88] J. Sullivan. A. Blake. M. Isard. J. MacCormick. Object localization by 
Bayesian correlation. ICCV [C]. 1999. 1068-1075. 

[89] Y. Li. H. Ai. T. Yamashita. S. Lao. M. Kawade. Tracking in low frame 
rate video: A cascade particle filter with discriminative observers of different 
life-spans. IEEE Trans. on PAMI [J], 2008. 30(10), 1728-1740. 

[90] J. Kwon. K. Lee. Tracking of abrupt motion using Wang-Landau Monte 
Carlo estimation. ECCV [C]. 2008, 387-400. 


[91] F. Wang. D. P. Landau. Efficient multiple-range random-walk algorithm 
to calculate the density of states. Physical Review Letters [J]. 2001, 86 
(10), 2050-2053. 

[92] B. A. Berg. T. Neuhaus. Multicanonical algorithms for lst-order phase- 
transitions, Physics Letters B [J]. 1991. vol. 267. 249 - 253. 

[93] F. Liang. C. Liu. R. J. Carroll. Stochastic approximation in Monte Carlo 
computation. J. Amer. Statist. Assoc. [J]. 2007. 102(477). 305 - 320. 

[94] X. Zhou. Y. Lu. Abrupt motion tracking via adaptive stochastic approxi- 
mation Monte Carlo sampling. CVPR [C]. 2010. 1847-1854. 

[95] W. K. Hastings. Monte Carlo sampling methods using Markov chains and 
their applications. Biometrika [J]. 1970, 57 (1). 97-109. 

[96] S. Geman, D. Geman. Stochastic relaxation, Gibbs distributions. and the 
Bayesian restoration of images. IEEE Trans. on PAMI [J]. 1984. 6(6). 
721-741. 

[97] J. S. Liu. F. Liang. W. H. Wong. A theory for dynamic weighting in 
Monte Carlo. J. Amer. Statist. Assoc. [J]. 2001. vol. 96. 561-573. 

[98] F. Liang. Dynamically weighted importance sampling in Monte Carlo com- 
putation. J. Amer. Statist. Assoc. [J]. 2002. vol. 97. 807-821. 

[99] W. Gilks. G. O. Roberts. S. Sahu. Adaptive Markov chain Monte Carlo 

through regeneration. J. Amer. Statist. Assoc. [J]. 1998. vol. 93. 

1045-1054. 


97 


f ) 视觉 跟踪 中 的 马 氏 链 蒙特 卡 洛 方法 


[100] 


[101] 


103] 


04] 


[108] 


[112] 


98 


Y. Atchadé. J. S. Rosenthal. On adaptive Markov chain Monte Carlo al- 
gorithms. Bernoulli [J]. 2005, vol. 11, 815-828. 
H. Haario. E. Saksman. J. Tamminen. An adaptive metropolis algo- 


rithm. Bernoulli [J]. 2001, 7(2), 223-242. 


] G. O. Roberts, J. S. Rosenthal. Coupling and ergodicity of adaptive 


Markov chain Monte Carlo algorithms. J. Appl. Probab. [J]. 2007. 44 
(2), 458-475. 

G. O. Roberts. J. S. Rosenthal. Examples of adaptive MCMC, J. Com- 
put. Graph. Statist. [J]. 2009, 18(2), 349-367. 

A. E. Gelfand, S. K. Sahu. On Markov chain Monte Carlo acceleration. Jour- 
nal of Computa- tional and Graphical Statistics [J]. 1994, vol. 3, 261-276. 

W. J. Browne, D. Draper. Implementation and performance issues in the 
Bayesian and likelihood fitting of multilevel models. Computational Statis- 


tics [J]. 2000, vol. 15, 391-420. 


] A. E. Brockwell. J. B. Kadane. Identification of regeneration times in 


MCMC simulation. with application to adaptive schemes. J. Comput. 


Graph. Stat. [J], 2005. vol. 14. 436 - 458. 


] C. Andrieu. C. P. Robert. Controlled MCMC for optimal sampling. MC- 


MC Preprint Service. 2002. http://www. ceremade. dauphine. fr/~ xian/ 
control. ps. gz. 

G. Casella. C. P. Robert. Rao-Blackwellisation of sampling schemes. Bi- 
ometrika [J]. 1996. 83(1), 81-94. 


JR. Y. Rubinstein. Simulation and the Monte Carlo method [M]. New 


York; John Wiley and Sons. 1981. 


]J. Geweke. Bayesian inference in econometric models using Monte Carlo 


integration. Econome- trica [J]. 1989. vol. 24. pp: 1317-1399. 


] N. Metropolis. A. W. Rosenbluth. M. N. Rosenbluth. A. H. Teller. 


E. Teller. Equation of state calculaiton by fast computing machines. Jour- 
nal of Chemical Physics [J]. 1953. vol. 21. 1087- 1091. 

J. S. Liu. F. Liang. W. H. Wong. The multiple-try method and local op- 
timization in Metropolis sampling. J. Amer. Statist. Assoc. [J]. 2000. 
vol. 95, 121-134. 


et C 


[113] C. P. Robert. G. Casella. Monte Carlo statistical methods (2nd edition) 
LM]. New York; Springer. 2004. 

[114] C. Ritter. M. A. Tanner. Facilitating the Gibbs sampler; the Gibbs stop- 
per and the griddy-Gibbs sampler. J. Amer. Statist. Assoc. [J]. 1992, 87 
(419), 861-868. 

[115] H. Robbins. S. Monro. A stochastic approximation method. The Annals 
of Mathematical Statistics [J]. 1951. vol. 22. 400-407. 

C. Yang. Recurrent, ergodic properties of adaptive MCMC. Preprint. 2008. 
L. Holden. R. Hauge. M. Holden. Adaptive independent Metropolis- 
Hastings. The Annals of Applied Probability [J]. 2009, 19(1). 395-413. 
[118] Y. Ren, Y. Ding. F. Liang. Adaptive evolutionary Monte Carlo algorithm 
for optimization with applications to sensor placement problems. Statistics 
and Computing [J]. 2008. 18(4). 375- 390. 

[119] A. Gelman, G. Roberts, W. Gilks. Efficient Metropolis jumping rules. 


In: Bayesian Statistics [M]. vol. 5. New York: Oxford University Press. 
1995. 

[120] C. Andrieu. É. Moulines. On the ergodicity properties of some adaptive 
MCMC algorithms. Ann. Appl. Probab. [J]. 2006. 16(3). 1462-1505. 
[121] G. O. Roberts. J. S. Rosenthal. Optimal scaling for various Metropolis- 
Hastings algorithms. Stat. Sci. [J]. 2001. vol. 16. 351-367. 


[122] F. Liang. Generalized Wang-Landau algorithm for Monte Carlo computa- 
tion. J. Amer. Statist. Assoc. [J]. 2005. vol. 100, 1311-1327. 

[123] Q. Yan. J. J. de Pablo. Fast Calculation of the density of states of a fluid 
by Monte Carlo simulations. Physics Review Letters [J]. 2003. 
90. 035701. 

[124] C. Andrieu, É. Moulines, P. Priouret. Stability of stochastic approxima- 
tion under verifiable conditions. SIAM Journal of Control and Optimization 
[J]. 2005. vol. 44, 283 - 312. 

[125] X. Zhou. Y. Lu. Efficient polygonal approximation of digital curves via 
Monte Carlo optimization. ICPR [C]. 2010, 3513-3516. 


[126] X. Zhou. Y. Lu. Polygonal approximation of digital curves using adaptive 
MCMC sampling. ICIP [C]. 2010. 2753-2756. 


3j 


) 视觉 跟踪 中 的 马 氏 链 蒙特 卡 洛 方法 


[127] M. K. Cowles. B. P. carlin. Markov chain Monte Carlo convergence diag- 
nostics; a comparative review. J. Amer. Statist. Assoc. [J]. 1996. 91 
(434), 883-904. 

[128] S. B. Brooks. G. O. Roberts. Assessing convergence of Markov chain Monte 
Carlo algorithms. Statistics and Computing [J]. 1999. vol. 8. 319-335. 

[129] O. Cappé. A. Guillin. J-M. Marin. C. P. Robert. Population Monte 
Carlo. J. Comput. Graph. Statist. [J]. 2004. 13(4), 907-929. 

[130] A. Gelman. D. B. Rubin. Inference from iterative simulation using multi- 
ple sequences. Statis- tical Science [J]. 1992. vol. 7. 457-511. 

[131] A. Gelman, J. B. Carlin, H. S. Stern, D. B. Rubin. Bayesian Data A- 
nalysis (2nd edition) [M]. London; Chapman & Hall. 2004. 


[132] B. K. Ray. K. S. Ray. A new split-and-merge technique for polygonal ap- 
proximation of chain coded curves. Pattern Recognition Letters [J]. 1995, 
vol. 16. 161-169. 

[133] A. Masood. Dominant point deletion by reverse polygonization of digital 


curves. Image and Vision Computing [J]. 2008. vol. 26. 702-715. 


[134] J. C. Perez. E. Vidal. Optimum polygonal approximation of digitized 
curves, Pattern Recog- nition Letters [J]. 1994. vol. 15. 743-750. 

[135] S. Y. Ho. Y. C. Chen. An efficient evolutionary algorithm for accurate 
polygonal approximation. Pattern Recognition [J]. 2001. vol. 34. 
2305-2317. 

[136] B. Wang. H. Shu. L. Luo. A genetic algorithm with chromosome-repai- 
ring for min-# and min- « polygonal approximation of digital curves. J. 
Vis. Commun. Image R. [J]. 2009. vol. 20. 45-56. 

[137] B. Wang. H. Shu. C. Shi. L. Luo. A novel stochastic search method for 
polygonal approximation problem. Neurocomputing [J]. 2008. vol. 71. 
3216-3223. 

[138] P. Y. Yin. Ant colony search algorithms for optimal polygonal approxima- 
tion of plane curves. Pattern Recognition [J]. 2003. vol. 36. 1783- 1997. 

[139] P. Y. Yin. A discrete particle swarm algorithm for optimal polygonal ap- 
proximation of digital curves. J. Vis. Commun. Image R. [J]. 2004. vol. 
15, 241-260. 


100 


et C 


[140] D. Sarkar. A simple algorithm for detection of significant vertices for po- 

lygonal approximation of chain-coded curves. Pattern Recogniton Letters 

[J]. 1993. vol. 14, 959-964. 

[141] D. J. Wales. J. P. K. Doye. Global optimization by basin-hopping and 

the lowest energy structure of Lennard-Jones clusters containing up to 110 

atoms. J. Phys. Chem. [J]. 1997. vol. 101, 5111-5116. 

[142] S. Kirkpatrick. C. D. Gelatt. M. P. Vecchi. Optimization by simulated 

annealing. Science [J]. 1983, 220(4598). 671-680. 

[143] R. van der Merwe. A. Doucet. J. F. G. de Freitas. E. Wan. The un- 
scented particle filter. Technical Report CUED/F-INFENG/TR 380, 


Cambridge University Engineering Department, Cambridge, 
England, 2000. 
[144] O. Cappe. S. J. Godsill. E. Moulines. An overview of existing methods 
and recent advances in sequential Monte Carlo. Proceedings of the IEEE 
[J]. 2007. 95(5), 899-924. 
[145] F. Liang. On the use of stochastic approximation Monte Carlo for Monte 
Carlo integration. Statistics and Probability Letters [J]. 2009. vol. 79. 
581-587. 
[146] Y. Chen. L. Tu. Density-based clustering for real-time stream data. ACM 
SIGKDD [C]. 2007. 133-142. 
[147 ] http: //vision. stanford. edu/ — birch/headtracker/seq/. 


101 


